close-icon
Abonnieren, um mehr über dieses Thema zu erfahren
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.

Machine Learning - die 4 wichtigsten Ansätze

Wie sollte dein Team an Machine Learning am besten herangehen? KI Forschung, Open Source, Machine Learning Plattformen oder APIs?

datarevenue-icon
by
DataRevenue
Markus Schmitt

Machine Learning kann sehr verwirrend sein. Der Begriff wird von vielen Leuten unterschiedlich verwendet und entwickelt sich ständig weiter. 

(Quelle: https://mattturck.com/data2019/)

Bevor man sich für einen KI-Anbieter oder Plattform entscheidet, ist es wichtig zu überlegen, welche Machine Learning "Ebene" für das geplante Vorhaben am besten geeignet ist. Man kann eine eigene KI komplett neu entwickeln, ein vorgefertigtes Produkt verwenden, oder sich für eine Zwischenlösung entscheiden. 

In diesem Artikel stellen wir die vier verschiedenen Optionen vor Machine Learning einzusetzen und helfen dabei, die Option auszuwählen, die sich für die eigene Situation am besten eignet. Um die Entscheidung anschaulicher zu gestalten, vergleichen wir die unterschiedlichen Optionen mit verschiedenen Transportmöglichkeiten. 

Die verschiedenen Machine Learning "Ebenen"

Ein Diagramm, das APIs, Machine Learning Plattformen, Open-Source-Frameworks und Forschung in Zusammenhang mit öffentlichen Verkehrsmitteln, Taxis, dem Besitz und dem Bau eines Autos setzt.
Ähnlich wie verschiedene Verkehrsmittel kann auch Machine Learning auf unterschiedliche Weise genutzt werden, um von A nach B zu kommen.
  • KI Forschung, z.B. die Entwicklung neuartiger Speech-to-Text-Algorithmen, lassen sich damit vergleichen, ein Auto zu bauen.
  • Open Source Frameworks (wie Tensorflow) zu verwenden und damit eine eigene Lösung zu entwickeln entspricht sein eigenes Auto zu kaufen.
  • ML Plattformen wie z.B. AWS SageMaker sind damit vergleichbar, ein Taxi zu nehmen.
  • APIs wie Google Translate lassen sich mit der Nutzung von öffentlichen Verkehrsmitteln vergleichen.

Man kann Machine Learning Lösungen auf verschiedenen Arten umsetzen. Angefangen bei komplett flexibler und ebenso komplizierter KI Forschung, bis hin zu sehr einfach aber sehr eingeschränkt nutzbaren APIs.

Jede Ebene baut dabei auf der vorherigen auf: APIs basieren meistens auf Machine Learning Plattformen, die auf Open-Source-Frameworks aufbauen, die wiederum auf KI Forschung basieren.

Unterschiedliche Probleme erfordern Lösungen auf unterschiedlicher Ebene

Welche Ebene für ein bestimmtes Projekt am besten geeignet ist, hängt hauptsächlich von dem Problem ab, das gelöst werden soll. 

Allerdings decken nicht alle Ebenen gleich große Bereiche ab: Es kommt zum Beispiel erstaunlich selten vor, dass ein Problem von einer Machine Learning Plattform vollständig gelöst werden kann.

Ein Balkendiagramm, das Question Answering und Speech to Text in der Forschung, automatisierte Wirkstoffsuche, ML-Diagnostik und automatisierten Handel, Vorhersagen von Abwanderung, Nachfrageprognosen, Recommender-Systeme in Machine Learning Plattformen sowie die Übersetzung und Navigation in APIs zeigt.
Die verschiedene Ebenen eignen sich jeweils für verschiedene Probleme. Machine Learning Plattformen decken dabei einen weitaus kleineren Bereich ab, als oft angenommen.

Da die Unternehmen, die Machine Learning Plattformen betreiben, sehr viel Marketing betreiben, wird der Wert dieser Plattformen oft überschätzt. In der Praxis bringen solche Plattformen oft die Inflexibilität von Standard-APIs mit sich, ohne dabei Notwendigkeit für Machine Learning Entwickler komplett zu nehmen.

Um die jeweiligen Unterschiede näher zu erläutern, sehen wir uns jede dieser Ebenen im Detail an.

KI-Forschung durchzuführen ist damit vergleichbar, ein eigenes Auto zu bauen

Wer vorhat, KI in sein Projekt einzubauen, denkt oft als erstes darüber nach, Doktoranden einzustellen. Diese Überlegung entspricht aber ungefähr dem Plan, ein Team von Ingenieuren anzuheuern und sie zu bitten – ein Auto zu bauen und sich dann rund um die Uhr um dieses eine Auto zu kümmern.

Als professioneller Rennfahrer mag das angemessen sein - in allen anderen Fällen jedoch weniger.

In einer kleinen Anzahl von Unternehmen – wie Google – macht das Sinn. Teams von Wissenschaftlern entwickeln neue Algorithmen treiben KI Forschung voran. Diese Arbeit ist kostspielig, und es vergehen häufig Jahre oder sogar Jahrzehnte, bis sie relevante Fortschritte erzielen.

Die meisten Unternehmen ziehen diesen Ansatz daher gar nicht mehr in Betracht. Solange man nicht zu den führenden 1% in der jeweiligen Branche gehört, macht ein eigenes Forschungsteam kaum Sinn.

Du solltest über eigene KI-Forschung nachdenken, wenn du z.B.:

  • Siri Konkurrenz machen möchtest und ein noch bessere Speech-to-Text Lösung entwickeln möchtest
  • In einem Kopf-an-Kopf-Rennen mit anderen Investmentbanken bist und deinen Tading-Algorithmen einen Vorteil verschaffen willst.

Die passende Teamstruktur für KI Forschung:

  • Ein Team von KI Forschern: Doktoranden, Postdocs und Professoren.
  • Ein Team von Entwicklern, Data Scientists und Machine Learning Engineers, die die Forschungsergebnisse in Machine Learning Lösungen umsetzen können.

Der Einsatz von Open-Source-Frameworks ist damit vergleichbar, ein eigenes Auto zu besitzen

Open-Source-Frameworks wie Tensorflow, PyTorch und Keras setzen die aktuellsten Forschungsergebnisse – in der Regel innerhalb von 1-2 Jahren – in einfache Softwaretools um. Weltweit tragen viele Tausende von Entwicklern, Forscher und Unternehmen zur kontinuierlichen Verbesserung dieser Frameworks bei.

Open Source Software kann kostenlos heruntergeladen und genutzt werden. Dabei handelt es sich um dieselben leistungsstarken Algorithmen ("Motoren"), die unter der Haube von teuren Machine Learning Plattformen (z.B. bei Amazon, Google oder Microsoft) verwendet werden. Mit den Open Source Tools kann man jedoch ein beliebiges System selbst entwickeln.

Aber ebenso wie der Besitz eines eigenen Autos bringen auch diese Frameworks einige Nachteile mit sich. Wenn man ein Auto besitzt, muss man lernen, wie man Auto fährt. Um Tools wie Tensorflow benutzen zu können, braucht man dementsprechend Entwickler die mit diesen Tools arbeiten.

Wer ein Auto besitzt, muss sich außerdem um Dinge wie Tanken, Reifenwechsel und die Suche nach einer zuverlässigen Werkstatt kümmern. Wenn man eigene maßgeschneiderte Machine Learning Lösungen entwickelt, muss man ebenso eine passende Infrastruktur aufbauen und pflegen.

Denke darüber nach Machine Learning Lösungen mit Open-Source-Frameworks zu entwickeln, wenn:

  • Du einen Arbeitsablauf verbessern möchtest, der so nur in deinem Unternehmen existiert.
  • Du bereits über die erforderlichen Daten und Kenntnisse verfügst.
  • Du dich nicht davor scheust, komplizierte Software-Projekte in Angriff zu nehmen.

Passende Teamstruktur um mit Open-Source zu arbeiten:

  • Internes Team: Ein Team aus DevOps Entwicklern, Machine Learning Entwicklern, Data Scientists, Projektmanagern und Fachexperten. 

OR 

  • Externes Team: Agenturen wie wir, die deine ML-Lösung mit Open-Source-Frameworks umsetzen.

Die Nutzung von Machine Learning Plattformen ist vergleichbar mit Taxi fahren

Manchmal braucht man eine schnelle Lösung und ist bereit, dafür etwas mehr zu bezahlen. Für eine einmalige, kurze Fahrt bietet es sich an, ein Taxi zu nehmen. Für regelmäßige und längere Fahrten lohnt es sich jedoch, ein eigenes Auto anzuschaffen.

In ähnlicher Weise ermöglichen Machine Learning Plattformen wie AWS Sagemaker, Dataiku, Knime und Alteryx einen schnelleren Einstieg und stellen einige vorgefertigte Komponenten zur Verfügung, die den Start erleichtern.

Aber obwohl diese Plattformen zwar Zeit einsparen können, sind sie oft weitaus eingeschränkter, als ihre Marketing-Teams zugeben würden. Ähnlich wie bei einem Taxi, ist es eher die falsche Lösung, wenn man es regelmäßig braucht. Außerdem stößt man meist früher als erwartet an die Grenzen dessen was mit einer ML Plattform möglich ist.

Du solltest eine Machine Learning Plattform in Betracht ziehen, wenn:

  • Machine Learning weder ein wichtiger Teil deines Unternehmens noch ein Wettbewerbsvorteil werden soll.
  • Du Machine Learning auf Standardprobleme anwenden möchtest, die bereits sehr bekannt und häufig gelöst wurden (z.B. Produkt Empfehlungssysteme, Churn-Analyse von Kunden, Nachfrageprognosen).

Die richtige Teamstruktur um ML Plattformen zu nutzen:

  • Mindestens ein Machine Learning Engineer, ein Entwickler und ein DevOps-Spezialist.

Notiz: Wir waren auch überrascht. Aber aus Erfahrung von vielen, die im Vertrieb von ML Plattformen gearbeitet haben: Der Einsatz einer ML Plattform ist meist nur dann erfolgreich, wenn die Plattform von Entwicklern verwendet wird, die theoretisch auch alle Funktionen der ML Plattform selbst entwickeln könnten. Sonst fehlen die notwendigen Grundlagen, um die Funktionen der Plattform richtig anzuwenden.

Die Verwendung von APIs ist damit vergleichbar, per Flugzeug zu reisen

Wenn man regelmäßig eine fixe Strecke, wie von London nach New York, reisen muss, dann sind öffentliche Verkehrsmittel in der Regel besser. Diese bieten zwar eine eher unflexible, aber dafür sehr simple und zuverlässige Form der Fortbewegung.

Ähnlich lassen sich APIs wie Google Translate am einfachsten in bestehende Infrastruktur integrieren. Sie lassen sich auch beliebig skalieren und bieten ein schwer zu übertreffendes Qualitätsniveau.

Gleichzeitig sind sie aber auch am wenigsten flexibel. Sobald man bestimmte Anforderungen einhalten möchte, sind APIs schnell nicht mehr anpassungsfähig genug. Außerdem zahlt man meistens Prämien: mit einer Übersetzungs-API zum Beispiel bezahlt man üblicherweise pro übersetztem Zeichen.

Du solltest APIs in Betracht ziehen, wenn du z.B.:

  • eine E-Commerce-Plattform verwaltest und möchtest, dass Benutzer automatische Übersetzungen von Rezensionen sehen, die in anderen Sprachen verfasst wurden.
  • ein Logistikunternehmen betreibst und automatische Routenoptimierungen für Lieferungen erstellen möchtest.

Das passende Team um KI APIs einzubinden:

  • Es reicht ein Entwickler, der die API in dein System integriert.

Die nächsten Schritte

Sobald du dich für eine dieser Ebenen entschieden hast, kannst du dich mit der Auswahl der richtigen Machine Learning Open Source Tools oder einer Machine Learning Plattform befassen.

Falls du noch etwas unsicher bist, vereinbare gerne einen kostenloses und unverbindliches Telefonat mit uns. Wir geben dir gerne unabhängige Tipps und erzählen dir, was bei anderen Teams gut funktioniert.

Bekomme immer die neusten Artikel

Trag dich mit deiner E-Mail ein, um du bekommst jede Woche unseren neusten Artikel.

Ich danke Ihnen! Ihre Einreichung ist eingegangen!
Oops! Something went wrong while submitting the form.