Weiter zum Inhalt

Machine Learning in der Produktion und Ihre MLOps-Lösungen

Heute ist unsere Welt, ob es uns gefällt oder nicht, untrennbar mit der des Cloud Computing verbunden. Sowohl industriell als auch gesellschaftlich. Diese Revolution in den Mentalitäten beschleunigte die Umkehrung der klassischen monolithischen Struktur, die bis dahin in einem Vakuum den gesamten Datenzyklus von der Aufnahme bis zur Restitution in einem Armaturenbrett unterstützt hatte. Cloud-Dienste haben nach und nach die Einführung eines „modernen Datenstapels“ ermöglicht, der sich auf Grundlagen wie dem „Data Lake“ und dann dem „Data Mesh“ ausbreitet.

Infolgedessen sind BI-Akteure (Business Intelligence) heute nicht mehr allein bei der Extraktion und Transformation der Rohdaten, die mehrere Quellen, intern oder nicht für das Unternehmen, im kontinuierlichen Fluss sammeln. Die Devise lautet „Offenheit gegenüber der Welt“ durch die Verbreitung von API-Diensten in internen Informationssystemen und im planetarischen Web. Die Richtlinien empfehlen nun die Umsetzung von ressortübergreifenden Governance-Richtlinien, um die Idee des Austauschs ihrer Daten zu fördern und zu gestalten.

Von Amazon EC2 zu Data Mining

Lassen Sie uns ein wenig Geschichte machen. An der Wende der 2010er Jahre beinhalteten Innovationen im Bereich der Informations- und Kommunikationstechnologien große organisatorische Neugestaltungen. Insbesondere mit der Einführung des Elastic Compute Cloud (EC2)-Service von Amazon Web Services (AWS) im August 2006, der es jedem ermöglicht, Instanzen virtueller Maschinen zu mieten, um seine eigenen Anwendungsprojekte online zu bringen. Und wer mehr Anwendungssoftware à la carte sagt, sagt mehr Metadaten generiert und damit mehr Statistiken zu erstellen und zu analysieren.

So hat um 2010 die Kultur des strategischen Managements durch Daten (datengetriebene Kultur) endgültig den Wind in den Segeln. „Digitale Daten sind das neue Öl“ lässt den Kapitalismus von morgen erahnen: kolossale Informationsvorkommen zu erwerben. daraus schwache Signale zu extrahieren und sich von der Konkurrenz abzuheben. Das Können von Predictive Analytics (und seiner präskriptiven Neigung) zwingt Führungskräfte, Profile einzustellen, die Experten für Data Mining, einen spezialisierten Zweig der Managementinformatik, sind. Diese atypische Position des Digitizers nutzt die Kunst, viele Zahlen zu zeichnen, um Gold zu gewinnen, indem statistische und probabilistische Theorien verwendet werden, die zur Implementierung von maschinellen Lernalgorithmen in Entscheidungsplattformen führen. Die Mission solcher Algorithmen wird es sein, einerseits die Wissensbasis und andererseits die User Experience durch die Veröffentlichung „intelligenter“ Antworten auf Empfehlungs-, Bewertungs- und Klassifizierungsanfragen zu bereichern. Die Begriffe „Data Science“ und „Data Team“ setzen sich dann unwiderlegbar in der dominanten Kultur fest.

Der Aufstieg des Data Scientist-Berufs

Dieses „Datenteam“ ist an sich die Vereinigung komplementärer Profile, um anspruchsvolle Analysen im Datenmanagementsystem wachsen zu lassen. Es geht darum, die Berufe von Ingenieuren und Naturwissenschaftlern zusammenzubringen. Tatsächlich vereint der Titel „Data Scientist“, der laut Harvard Business Review den Wert des „sexiest job of the 21st century“ annimmt, die folgenden Fähigkeiten:

  • Neigung zur Forschung in der angewandten Mathematik
  • Talent als Kommunikator
  • Neigung zur Entwicklung von Infrastrukturarchitekturplänen

Eine solche Beschreibung des Berufs des Datenwissenschaftlers (von amerikanischem Einfluss und in vielerlei Hinsicht ähnlich dem des Digitizers) war auf den ersten Blick verwirrend für Anfänger in diesem Bereich: Fähigkeit, die strategischen Probleme des Unternehmens wahrzunehmen, Fähigkeit, eine angemessene Arbeitsmethodik voranzutreiben, Wunsch, sich an den Überlegungen über die Wahl der Software- und Hardwareausrüstung zu beteiligen, und bei der Berücksichtigung von Sicherheits- und ethischen Fragen. Wie weit reichen seine Verantwortlichkeiten und an wen sollen seine Standorte im Falle von Bedarf oder mangelnder Kompetenz delegiert werden?

Zwischen Agile und DevOps, MLOps

Um 2017 herum kommt in Frankreich und anderswo der Tiefpunkt der Welle. Die Beobachtung eines noch zu unreifen Marktes schreckt Wirtschaftsführer ab: Zu wenige Proofs of Concept für maschinelles Lernen schaffen es, die Produktionsphase zu überstehen.

Es geht dann darum, wie beim Software Engineering das richtige Ökosystem aufzubauen, in dem die Data-Science-Kultur gedeihen kann.  Agile und DevOps-Manifeste haben das Paradigma des Software-Publishing radikal verändert. Warum lassen Sie sich nicht von diesen zeitgenössischen Denkströmungen inspirieren, um ein Ökosystem zu schaffen, das den Lebenszyklus eines Produkts mit maschinellem Lernen rationalisiert? Ein Plan, der reibungslos von der Entwurfsphase bis zur Industrialisierungsphase und natürlich über den Produktionsbeginn Es geht dann darum, wie beim Software Engineering das richtige Ökosystem aufzubauen, in dem die Data-Science-Kultur gedeihen kann.  Agile und DevOps-Manifeste haben das Paradigma des Software-Publishing radikal verändert. Warum lassen Sie sich nicht von diesen zeitgenössischen Denkströmungen inspirieren, um ein Ökosystem zu schaffen, das den Lebenszyklus eines Produkts mit maschinellem Lernen rationalisiert? Ein Plan, der reibungslos von der Entwurfsphase bis zur Industrialisierungsphase und natürlich über den Produktionsbeginn (Es geht dann darum, wie beim Software Engineering das richtige Ökosystem aufzubauen, in dem die Data-Science-Kultur gedeihen kann.  Agile und DevOps-Manifeste haben das Paradigma des Software-Publishing radikal verändert. Warum lassen Sie sich nicht von diesen zeitgenössischen Denkströmungen inspirieren, um ein Ökosystem zu schaffen, das den Lebenszyklus eines Produkts mit maschinellem Lernen rationalisiert? Ein Plan, der reibungslos von der Entwurfsphase bis zur Industrialisierungsphase und natürlich über den Produktionsbeginn Es geht dann darum, wie beim Software Engineering das richtige Ökosystem aufzubauen, in dem die Data-Science-Kultur gedeihen kann.  Agile und DevOps-Manifeste haben das Paradigma des Software-Publishing radikal verändert. Warum lassen Sie sich nicht von diesen zeitgenössischen Denkströmungen inspirieren, um ein Ökosystem zu schaffen, das den Lebenszyklus eines Produkts mit maschinellem Lernen rationalisiert? Ein Plan, der reibungslos von der Entwurfsphase bis zur Industrialisierungsphase und natürlich über den Produktionsbeginn hinaus durchgeführt werden soll.
Datenzentrierte Unternehmen erwerben somit die Best Practices von Software-Ingenieuren, wobei in erster Linie die der schnellen Iteration mit der des Versionsmanagements in einem System wie Git verbunden ist. Auf der anderen Seite geben der Continuous Integration/Continuous Deployment (CI/CD)-Prozess und die Verwendung virtueller Container (Docker, Kubernetes) der Data-Science-Kultur eine echte Hebelkraft, um den Produktionsfluss zu bedienen. Geboren (um 2018) der Begriff „Machine Learning Operations„, in Anlehnung an das Ökosystem „Development Operations“, das diese Betriebsarten bereits im Bereich der konventionellen Anwendungsentwicklung propagiert.

Die Definition von MLOps kann noch heute über ihre eigene Identität angesichts der „DevOps„-Philosophie diskutiert werden. Der Begriff „Continuous Training“ wird zusätzlich zum ursprünglichen CI/CD-Loop hinzugefügt.  Abgesehen von dieser CT+CI/CD-Spezifität, was sind die wichtigsten Nuancen?

Objektiv bezieht sich der Begriff MLOps auf eine Organisation, ein Ökosystem, durch das Best Practices im Laufe der Zeit reifen, um die Robustheit eines operativen Mechanismus sicherzustellen. Die primäre Absicht ist, dass jedes ML-Projekt Zugang zu den richtigen Ressourcen in einer Arbeitsumgebung hat, die für die Aktivitäten von Datenwissenschaftlern konzipiert ist:

  • Die empfohlene Organisationsweise basiert somit auf einem agilen Ansatz zur Anpassung an ungeplante Veränderungen (wie z.B. eine Weiterentwicklung des Kundenbedarfs oder eine im System erkannte Sperranomalie).
  • Darüber hinaus fördert die MLOps-Community die Akkulturation von Datenwissenschaftlern an das Konzept der kontinuierlichen Lieferung, um das Kunststück zu erreichen, ihre Produkte in die Produktion zu bringen, insbesondere indem die Hinzufügung von technischen Schulden im bestehenden Stack so weit wie möglich minimiert wird.

Die fraglichen MLOps-Mechaniken beziehen sich expliziter auf die Ausrichtung einer Reihe von Aufgaben, die man umsetzen muss, um einen „Schätzer“ zu produzieren und den Kunden zur Verfügung zu stellen.  Ein Dienst, der auf Bedarfsberechnungen statistischer Schätzungen basiert, verwendet ein Modell, das von einer lernenden Maschine „geformt“ wurde. Es sollte auch beachtet werden, dass das kommerzielle Interesse eines solchen Dienstes darin besteht Daten, die Analysten wissen möchten, einen glaubwürdigen Wert zuzuschreiben. Aber dass das Unternehmen aus Gründen der Mittel (technisch, finanziell, politisch, …) darauf verzichtet, über gängige Verfahren, wie die Installation elektronischer Sensoren oder das Eingreifen menschlicher Experten, zu erwerben.

Unser Ansatz für MLOps

Bis heute stellt MLOps für die DEVOTEAM ML-Community eine Investition in einen angemessenen strukturellen (organisatorischen und infrastrukturellen) Rahmen dar. Mit dem Schlüssel zu einer Startrampe, um schnell und gut den Service in Bezug auf den gewünschten Schätzer aufzubauen. Nehmen wir an, Datenwissenschaftler möchten Zugang zu einer MLOps-Plattform, um Reibungspunkte in Markteinführungskanälen so weit wie möglich zu reduzieren.  Verschwenden Sie keine Zeit mit einer Intuition sondern konfrontieren Sie sie mit einem Klick mit dem Zufriedenheitsmesser der Benutzer ihres ML-Dienstes.
Diese Plattform beinhaltet natürlich die entsprechenden Vorkehrungen in Bezug auf Stabilität, Sicherheit und Achtung der Vertraulichkeit sensibler Daten. Auf eine Weise, dass jedes ML-Produkt vom Vertrauen sowohl der Sicherheitsmanager für Informationssysteme (CISOs) als auch der Datenschutzbeauftragten (DSB) profitiert.

Zu Beginn des Jahres 2020 sind die Wirtschaftsführer nun überzeugt und dabei, sich an dieses neue Ökosystem zu akkulturieren. Maschinelles Lernen kann sich zweifellos für eine Vielzahl von geschäftskritischen Anwendungen als nützlich erweisen. Die größte Herausforderung besteht darin, die verschiedenen Komplexitäten der Disziplin in einem kommerziellen Kontext beheben zu können, der die Frage nach der Fähigkeit zur Skalierung aufwirft.

Der Wechsel zu ML Ops wirft jedoch neue Fragen auf:

  • Wie rekrutiert man angemessen in das Team?
  • Und wie können Sie klug in Marktlösungen investieren, um Ihre Plattform einzurichten?
  • Ist es besser, selbst zu bauen oder sich auf Lösungen zu verlassen, die auf dem Markt vertrieben werden?
  • Wie kann man Führungskräfte für die Prinzipien und Einschränkungen der Einführung einer ML-Lösung sensibilisieren, um ihren Mehrwert zu erhalten?

Die Frage der Rechenschaftspflicht ist auch ein kritisches Thema von MLOps. Das SLA-Engagement (Service Level Agreement) für Kunden mit einem prädiktiven Tool erfordert die Umsetzung von Bestimmungen, die das Krisenmanagement erleichtern. Wen soll man im Falle eines Zwischenfalls dringend um 02:00 Uhr morgens herbeirufen? Wer trägt im Falle eines Misserfolgs welche Verantwortung?

Diese Themen, haben wir im Rahmen eines Whitepapers zum Thema Machine Learning in der Produktion und ML Ops-Lösungen in der Cloud ausführlich für Sie zusammengefasst und steht zum Download zur Verfügung.

Folgen Sie uns jetzt auf LinkedIn, um keine News mehr zu verpassen!