ML2KMU

ML2KMU ist eine Initiative zur Steigerung der Digitalen Souveränität in der Wirtschaft. Insbesondere produzierende KMU sowie Unternehmen des Maschinen- und Anlagenbaus sind herausgefordert, digitale Technik zu nutzen und dabei ihre Wissensbasis und ihre Kompetenzen zu erweitern, und dabei nicht in extreme Abhängigkeit von einzelnen Technikanbietern oder Plattformen zu geraten.
Eine Schlüsseltechnologie bildet hierbei Maschinelles Lernen (ML) als Grundlage einer intelligenten Datennutzung bis hin zu neuen, datengetriebenen Geschäftsmodellen.
ML2KMU bietet eine Plattform zur Ableitung von Maßnahmen zur berufsbegleitenden Entwicklung von ML-Kompetenzen für produzierende KMU sowie den Maschinen- und Anlagenbau.

Rollenmodell

Management
Grundsätzlich hat das Management eine wichtige Rolle zu spielen. Ohne die aktive Beteiligung, die Initiative oder die Unterstützung des Managements wird es keinen dauerhaften Erfolg für eine ML-gesteuerte Initiative in Fertigungsunternehmen geben. Die Aufgaben bestehen darin, eine gemeinsame Vision zu formulieren und Projekte zu initiieren. Die Zusammenstellung des Projektteams und die Bereitstellung von Ressourcen (z.B. Budget und Arbeitszeit) spielen eine wichtige Rolle. Darüber hinaus kann das Management als Türöffner fungieren, indem es die interne abteilungsübergreifende Kommunikation fördert, aber auch externe Partner einbindet. Während des Projekts nimmt das Management eine eher passive Rolle ein, indem es das Projektteam bei Bedarf berät, bei Eskalationen und der Schlichtung von Konflikten unterstützt, an wichtigen Punkten Entscheidungen trifft und durch Reporting und Controlling über den Fortschritt informiert ist. Auch wenn neue agile Ansätze wie SCRUM zur operativen Umsetzung gewählt werden, muss das Management die organisatorischen Voraussetzungen dafür schaffen. Darüber hinaus ist sie sowohl strategisch für die Einbindung von ML-Projekten in die Unternehmensstrategie verantwortlich als auch operativ an deren Umsetzung beteiligt. Die Anforderungen an die Rolle des Managements spiegeln sich auch im Kompetenzprofil wider (Abbildung 4). Ein hohes Maß an Selbst- und Methodenkompetenz ist erforderlich, um die Teams mit den entsprechenden Werkzeugen auszustatten und für allgemeine Visionen und spezifische ML-getriebene Initiativen zu begeistern. Darüber hinaus hilft soziale Kompetenz bei der Zusammenstellung der richtigen Teams und der Lösung von Konflikten. Weniger notwendig im Management sind technische Kompetenzen, die von den anderen Rollen abgedeckt werden. Hervorzuheben ist das Fachwissen, da es für die Beurteilung der praktischen Anwendbarkeit und Relevanz der Analyseergebnisse von grundlegender Bedeutung ist.
IT
Die Rolle der IT ist von grundlegender Bedeutung für die datengesteuerte Anwendung von ML. Zum einen gibt sie Aufschluss über die Möglichkeiten und Beschränkungen produktiver IT-Systeme, z. B. beim Zugriff auf Datenquellen. Außerdem hilft sie bei der Berücksichtigung rechtlicher Belange wie Datenschutz und Sicherheit. Die IT-Rolle sollte einen umfassenden Überblick über geeignete IKT (z. B. Datenbanktechnologien, IT-Protokolle, Edge-Dienste und Plattformen) haben. Sie spielt eine grundlegende Rolle bei der Implementierung von Architekturen für ML. In kleineren Unternehmen und einmaligen Projekten kann dies recht einfach sein, einschließlich des Hostings von Servern und der Bereitstellung des Datenzugriffs, der Installation von Analysesoftware und der Bereitstellung von Einsatzmöglichkeiten. Bei fortgeschrittenen Projekten mit höherer Komplexität, bei denen z. B. größere Datenmengen verarbeitet werden und eine höhere Rechenleistung erforderlich ist, richtet die IT-Abteilung Plattformlösungen und verteilte Rechen- und Speicherdienste ein und wartet diese oder ermöglicht die Nutzung kommerzieller Plattform-, Infrastruktur- oder Software-as-a-Service-Lösungen (PaaS, laaS, SaaS). Darüber hinaus werden Dienstleistungen und der Betrieb eines eigenen Plattform-Ökosystems für Maschinenhersteller immer wichtiger. Die Rolle der IT ist daher als heterogen zu betrachten und lässt sich teilweise in weitere Unterrollen differenzieren, z.B. Data Engineers, Solution Architects oder Plattformteams. Die wichtigsten Kompetenzanforderungen sind spezifische technische Kompetenzen wie IKT-Kenntnisse und Datenmanagement. Grundlegende ML-Kenntnisse sind hilfreich, um die Anforderungen an Architekturen sowohl für Tests und Schulungen als auch für die Einführung zu verstehen und sie in Implementierungen umsetzen zu können. Ein Grundwissen über den Anwendungsbereich trägt ebenfalls dazu bei.
Domänenexperten
Domänenexperten spielen eine zentrale Rolle in ML-Implementierungsprojekten in der Fertigungsindustrie, da sie das fundierteste Wissen über wertschöpfende Fertigungsprozesse mitbringen. Sie können den Ausgangspunkt für ein Projekt darstellen und den Bedarf in realen Anwendungsszenarien identifizieren. In den interdisziplinären Teams erklären sie den anderen beteiligten Akteuren die Probleme und spielen eine wichtige Rolle beim Brainstorming von Lösungen, da sie sowohl die Möglichkeiten als auch die Einschränkungen der realen Prozesse am besten einschätzen können. In diesem Zusammenhang ist es auch ihre Aufgabe, Anforderungen an die zu entwickelnden Lösungen zu definieren. Darüber hinaus spielt die Definition von Leistungs- und Ergebnisindikatoren eine wichtige Rolle, mit denen sich sowohl Probleme als auch Verbesserungen quantifizieren lassen. Fachexperten kennen die IT-Systeme aus der Sicht der Nutzer und können die Bedingungen für Einsatzmöglichkeiten definieren. Sie helfen auch bei der Bewertung und Validierung von Modellergebnissen im Hinblick auf die Übertragbarkeit und Anwendbarkeit auf reale Prozesse. Im Hinblick auf das Kompetenzprofil sind die Bedingungen der Selbst-, Sozial- und Methodenkompetenz mit denen in der IT vergleichbar und durchaus nützliche Eigenschaften für die tägliche Arbeit. In ML-Implementierungsprojekten müssen diese jedoch nicht unbedingt voll ausgeprägt sein, da die Projektmanagementaufgaben von der Orchestrationsrolle übernommen werden. Daher ist die fachliche Kompetenz von höchster Bedeutung. Einerseits können grundlegende IKT-Kenntnisse nicht schaden, um die IT-Systeme, die zugrunde liegenden Daten sowie mögliche Einsatzszenarien verstehen zu können. Die Schlüsselkompetenz der Domänenexperten ist jedoch das Domänenwissen, das sowohl Prozesswissen als auch allgemeine ML- und Einsatzpotenziale umfasst.
Data Scientist
Um ML-basierte Analysen zu ermöglichen, zielt die Rolle des Data Scientist darauf ab, ML- und KI-bezogenes Know-how zu integrieren. Grundsätzlich bringt die Rolle Strukturierungsmöglichkeiten und Vorgehensmodelle für ML-Projekte. Eine wesentliche Aufgabe besteht zunächst darin, die Bewertung der Datenverfügbarkeit und -qualität aus ML-orientierter Sicht zu ermöglichen. Ziel ist es in diesem Zusammenhang, Visionen und Ideen in realistische Erwartungen zu übersetzen. Darüber hinaus hilft es bei der Auswahl von Software für die ML-Umgebungen. Die inhaltlichen Data Science Aufgaben wie Feature Engineering, explorative Analysen sowie Training und Validierung von Modellen werden von dieser Rolle übernommen. Die permanente Abstimmung mit den Domain Experts ist wichtig, um die Machbarkeit und Praktikabilität der Analysen sicherzustellen, die Qualität der Lösungen zu erhöhen und Akzeptanz für spätere Einsätze zu schaffen. Darüber hinaus spielt der Data Scientist eine wichtige Rolle bei der Gestaltung der Einsatzumgebung, die sich mit der Operationalisierung der Modelle befasst. Insbesondere die Überführung von Analyseprozessen in Scoring-Prozesse muss durch den Data Scientist in enger Abstimmung mit IT- und Fachexperten erfolgen. Das Kompetenzprofil adressiert grundlegende methodisch-logische Kompetenzen, um eine strukturierte Umsetzung von ML-Projekten zu ermöglichen. Da ein Großteil der Umsetzung vom Data Scientist abhängt, sind auch Selbst- und Sozialkompetenzen gefragt. Die Kernaufgaben bestehen jedoch aus technischen Kompetenzen in ML wie Programmiersprachen, Lernstrategien und Softwaretools. Darüber hinaus muss ein Data Scientist über hohe Kompetenzen in den Bereichen IKT, Datenmanagement und Statistik verfügen, um ein adäquates Datenverbindungsmanagement aufzubauen und die Fähigkeit der Modellinterpretation darstellen zu können.
Citizen Data Scientist (CDS)
Als koordinierende Rolle zwischen den spezifischen Rollen des Domänenexperten, der IT und des Data Scientist sowie des Managements wird eine integrierende Position des operativen Projektmanagements benötigt. Diese orchestrierende Rolle des CDS ist verantwortlich für typische Projektmanagementaufgaben wie Terminorganisation, Zeitplanung und Stakeholder-Management. Er leitet die Analyse der aktuellen Situation und die Sammlung von Anforderungen in den frühen Projektphasen des Geschäfts- und Datenverständnisses. Der CDS spielt eine wichtige Rolle bei der Übersetzung von realen Problemen in ML-Probleme. Während der technischen Arbeiten moderiert er zwischen den verschiedenen Akteuren, trägt zur Entscheidungsfindung bei und berichtet der Geschäftsleitung über den Projektfortschritt. Im Verlauf eines ML-Implementierungsprojekts muss sie verschiedene ML-relevante Inhalte wie IT-Systeme, Datenqualität, Software- und Modellauswahl, Bewertungskriterien, Leistungsmetriken usw. bewerten. All dies führt zu einem neuen Berufsbild des CDS, da auch in dieser Rolle zahlreiche Data Science bezogene Fähigkeiten in einem handlungsorientierten Maße entwickelt werden müssen. Das Kompetenzprofil der CDS-Rolle spiegelt die Anforderungen der heterogenen Aufgaben wider. So muss die zentrale Koordinationsrolle die unterschiedlichsten Kompetenzanforderungen erfüllen. Als zentraler Ansprechpartner für das Projekt muss er über ein Höchstmaß an Selbst-, Sozial- und Methodenkompetenz verfügen. Dazu gehören Teambildungs- und Motivationsfähigkeiten ebenso wie Organisationstalent, analytisches, strukturiertes und strategisches Denken, Flexibilität, Offenheit und Anpassungsbereitschaft. Darüber hinaus benötigt der Cit izen Data Scientist hohe praktische Kompetenzen in ML und insbesondere Domänenwissen und schafft dadurch Akzeptanz für Modelle und Einsätze.

Glossar

Data Science
Data Science ist ein interdisziplinäres Wissenschaftsfeld, welches wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturierten als auch unstrukturierten Daten ermöglicht. Personen, die im Bereich Data Science arbeiten, werden als Data Scientist bzw. Datenwissenschaftler bezeichnet, wobei meist speziellere oder Spezialisierungen anderer, übergeordneter Berufsbezeichnungen üblich sind.
Digitale Souveränität
Digitale Souveränität bezeichnet die Möglichkeit und Fähigkeit, digitale Technik kompetent und zielgerichtet für eigene Zwecke so einzusetzen, dass die eigene Handlungsfähigkeit und Kompetenz zumindest erhalten bleiben, möglichst wachsen. Digitale Souveränität betrifft die einzelnen Mitarbeiter und Gruppen von Mitarbeitern in ihren Arbeitskontexten. Hier stellen sich Fragen nach (Teil-) Autonomie und Lernförderlichkeit der Arbeitsbedingungen (Organisation und Technik). Digitale Souveränität betrifft ebenso das ganze Unternehmen. Insbesondere kleine und mittelständische Unternehmen sind herausgefordert, digitale Technik zu nutzen und dabei ihre Wissensbasis und ihre Kompetenzen möglichst zu erweitern, und dabei nicht in extreme Abhängigkeit von einzelnen Technikanbietern oder Plattformen zu geraten.
Künstliche Intelligenz (KI)
KI ist ein Teilgebiet der Informatik, das sich mit der Automatisierung intelligenten Verhaltens und dem maschinellen Lernen befasst. Meist bezeichnet KI den Versuch, bestimmte Entscheidungsstrukturen des Menschen nachzubilden, indem z. B. ein Computer so gebaut und programmiert wird, dass er relativ eigenständig Probleme bearbeiten kann. Oftmals wird damit aber auch eine nachgeahmte Intelligenz bezeichnet, wobei durch meist einfache Algorithmen ein „intelligentes Verhalten“ simuliert werden soll, etwa bei Computergegnern in Computerspielen.
Maschinelles Lernen (ML)
Maschinelles Lernen ist ein Oberbegriff für die datengetriebene Generierung von Wissen aus Erfahrung: Ein System lernt aus Beispielen und kann diese nach Beendigung der Lernphase verallgemeinern. Dazu bauen Algorithmen beim maschinellen Lernen ein statistisches Modell auf, das auf Trainingsdaten beruht und welches gegen die Testdaten getestet wird. Die praktische Umsetzung geschieht mittels Algorithmen. Verschiedene Algorithmen aus dem Bereich des maschinellen Lernens lassen sich grob in drei Gruppen einteilen: Überwachtes Lernen (englisch supervised learning), unüberwachtes Lernen (englisch unsupervised learning) und bestärkendes Lernen (engl. reinforcement learning).