close-icon
Abonnieren, um mehr über dieses Thema zu erfahren
Thank you! Your submission has been received!
Oops! Something went wrong while submitting the form.

Die 3 Grundlagen von KI (ohne Mathematik)

Was Sie über KI wissen müssen

datarevenue-icon
by
DataRevenue

Es wird viel über Machine Learning und KI gesprochen. Trotzdem denken viele noch immer, dass maschinelles Lernen eine komplizierte Angelegenheit ist. Doch das muss es gar nicht sein.

Wenn Sie schon immer an diesen Fragen interessiert waren und Ihre eigenen Anwendungsfälle für KI finden möchten, erfahren Sie hier, was Sie wissen müssen:

  1. Was ist maschinelles Lernen?
  2. Wann kann man maschinelles Lernen anwenden?
  3. Was sind die häufigsten Missverständnisse?

1. Was ist maschinelles Lernen?

Nehmen wir an, Sie wollen eine Wissenslücke schließen. Sie wollen die Informationen nutzen, die Sie haben, um andere Informationen effektiv vorherzusagen. Wissen zu vermitteln ist normalerweise eine Aufgabe für Menschen. Aber das Spannende am maschinellen Lernen ist, dass jetzt auch Computer etwas lernen können.

Maschinelles Lernen ist nur ein Instrument - eine Software, mit der Sie wertvolle Muster in großen Datenmengen finden können. Sobald die Software diese Muster identifiziert und gespeichert hat, können Sie sie für Vorhersagen verwenden.

Beim maschinellen Lernen geht es also um automatisierte Vorhersagen: automatisch Muster finden und nutzen.

Daten → Muster → Prognosen

Beispiel

Nehmen Sie ein gewünschtes Ergebnis (ein Kunde kauft ein Produkt) und einige Einflussfaktoren (alles, was der Kunde vorher gemacht hat). Man könnte sich fragen: Welches Verhalten bedeutet, dass ein Kunde einen Kauf tätigt und welches nicht? Je besser Ihre Antwort auf diese Frage ist, desto besser können Sie in Zukunft die Einkäufe jedes Kunden vorhersagen.

Verhalten → Muster → Kauf

Wie findet man Muster ohne maschinelles Lernen?

Wenn Sie kein maschinelles Lernen verwenden, können Sie versuchen, die Muster von einem Experten zu bekommen. Zum Beispiel, was unterscheidet nach der Meinung Ihres Produktmanagers Käufer von Nicht-Käufern?

Basierend auf den Antworten auf diese Frage können Sie einige Regeln aufschreiben und mit einem Programmierer daran arbeiten, diese Regeln mit Software zu automatisieren. Eine Beispielregel könnte sein:

“Jeder Benutzer, der in den letzten 24 Stunden mehr als 4 Produkte gesehen hat, wird als High Potential gekennzeichnet”.

Dieser Ansatz hat jedoch einige Nachteile:

Er ist langsam und teuer. Die Informationen zu sammeln und vor allem die Software zu schreiben, kostet viel Zeit und Ressourcen.

Er ist grob. Der Mensch hat keine sehr genaue Vorstellung von der besten Grenze zwischen hohem und niedrigem Potenzial: Sind es 4 Produktansichten oder 7? Der Input, den Sie erhalten, wird außerdem durch menschliche Meinungen beeinflusst, was bedeutet, dass Sie keine überraschenden Muster finden werden.

Er ist wenig komplex. Wir sind alle schlecht darin, sehr komplexe Interaktionen niederzuschreiben, sei es auf Papier oder in Software. Sobald Sie 6 oder mehr Regeln haben, wird es schwierig, weitere hinzuzufügen, ohne das Gesamtbild aus den Augen zu verlieren.

Maschinelles Lernen automatisiert diese Schritte

Maschinelles Lernen kann automatisch Muster in Daten finden und diese dann in einen Regelsatz (auch Modell genannt) schreiben.

Im Vergleich zur menschlichen Intuition hat dieses Verfahren klare Vorteile:

Es ist datenbasiert. Der Algorithmus ist nicht voreingenommen. Er findet jedes Muster in den Daten, einschließlich schrulliger, überraschender Muster, die für uns vielleicht auf den ersten Blick gar keinen Sinn machen.

Es ist schnell und preiswert. Selbst wenn Sie ein Modell auf einem riesigen Datensatz von mehreren Terabyte laufen lassen, kostet Sie das in der Regel nicht mehr als $10 an Cloud Computing Koten. In der Regel sprechen wir hier über ein paar Cents.

Es ist smart. Computer sind sehr gut in genauen Berechnungen, und sie verfügen über ein perfektes Gedächtnis. Für Software ist es also ziemlich einfach, große, miteinander verbundene Regelsätze zu erstellen. Die Modelle, die ein maschineller Lernalgorithmus erzeugt, können ohne Weiteres tausende von Regeln haben, die viele winzige Muster erfassen. Und dabei haben sie nur ein Ziel vor Augen: die genauesten Vorhersagen zu machen.

2. Wann kann man maschinelles Lernen anwenden?

Maschinelles Lernen ist ein mächtiges Instrument, aber nur, wenn bestimmte Bedingungen erfüllt sind:

  • 1. Sie brauchen viele Beispiele
  • 2. Die Beispiele müssen genau das Ergebnis enthalten, das Sie vorhersagen wollen
  • 3. Die Eingabedaten müssen relevant sein
  • 4. Ihre Daten müssen ordentlich quantifiziert werden
1. Sie brauchen viele Beispiele

Um genauer zu sein, benötigen Sie mindestens 500 Beispiele von jedem der Ergebnisse, die Sie vorhersagen möchten. Wenn Sie vorhersagen möchten, wann ein Benutzer ein bestimmtes Produkt kaufen wird, benötigen Sie mindestens 500 Beispiele von Benutzern, die dieses Produkt gekauft haben und 500 Beispiele von Benutzern, die dies nicht getan haben.

2. Die Beispiele müssen genau das Ergebnis enthalten, das Sie vorhersagen wollen

Zum Beispiel: Von einem Algorithmus, der darauf basiert, wie viele Benutzer ein Produkt liken, können Sie keine Vorhersagen dazu erwarten, wie viele Benutzer dieses Produkt kaufen werden.

Im Gegensatz zu Menschen übertragen maschinelle Lernalgorithmen das Lernen nicht von einer Situation auf eine zwar ähnliche, doch im Grunde ganz andere Situation. Es muss die gleiche Situation sein: genau die gleichen Inputfaktoren und dieselben Prognoseergebnisse.

3. Die Eingabedaten müssen relevant sein

Maschinelles Lernen kann nur dann Muster finden, wenn diese in Ihren Daten vorhanden sind. Die wichtigsten Informationen für die richtige Vorhersage müssen in den Daten enthalten sein, auf denen Sie das Modell laufen lassen. Nur dann ist das Modell in der Lage, die richtigen Muster zu finden.

Wenn Sie z.B. den nächsten Einkauf eines Benutzers vorhersagen wollen, müssen Sie seine bisherigen Einkäufe als Eingabedaten haben, da diese natürlich wertvolle Informationen über seinen nächsten Einkauf enthalten.

Wenn Sie nur diese Informationen im CRM haben, während die anderen Informationen, z.B. wie oft er sich eingeloggt hat, in Ihren Webanalysedaten enthalten sind, dann sollten Sie sich die Mühe machen, diese Datensätze zu verbinden.

Es gibt eine schnelle Möglichkeit zu prüfen, welche Datensätze Sie als Eingabefaktoren benötigen: Welche Informationen würden Sie als Mensch verwenden, um eine gute Vorhersage zu treffen? Was könnte relevant sein?

Unser Gehirn ist sehr leistungsstark, wenn es darum geht, unterbewusst Muster zu finden, deshalb sind unsere Intuitionen dazu, welche Daten nützlich sein könnten, sehr gut.

Umgekehrt, wenn Sie glauben, dass Sie als Mensch das Ergebnis aufgrund dieser Eingaben wahrscheinlich nicht vorhersagen können, ist das ein Warnsignal. Maschinelle Lernen wird in dem Fall wahrscheinlich auch nichts finden, also ist dies vielleicht kein guter Kontext, um es anzuwenden.

Das menschliche Unterbewusstsein ist ein Meister der Musterfindung. Wir brauchen vielleicht länger, aber wir sind trotzdem besser. Wenn wir es nicht schaffen, wird es ein Algorithmus wahrscheinlich auch nicht hinbekommen.

4. Ihre Daten müssen ordentlich quantifiziert werden

Algorithmen des maschinellen Lernens können in der Regel nur mit Daten in einem Format arbeiten, das wie eine Excel-Tabelle aussieht: in Tabellenform.

Der Algorithmus hat weder unsere Sinne noch unser Verständnis. Zum Beispiel kann er keinen Text lesen. Er versteht Text als Zahlen, als Anzahl von Wörtern und Buchstaben.

Sie müssen die Eingabefaktoren ordentlich in einem maschinenlesbaren Format aufbereiten. Dieser Prozess ist extrem wichtig und wird als Feature Engineering bezeichnet. Das Feature Engineering ist viel wichtiger als der Algorithmus, mit dem Sie arbeiten. Je besser Sie die Daten aufbereiten, desto besser kann der Algorithmus lernen und desto besser werden Ihre Vorhersagen sein.

3. Was sind die häufigsten Missverständnisse?

Gegenüber weit verbreiteten Missverständnissen gilt es 3 Dinge festzuhalten:

  1. KI ersetzt keine Menschen
  2. Der Algorithmus ist nicht so wichtig
  3. Maschinelles Lernen ist kein “lernendes System”

KI ersetzt keine Menschen

Wenn ein Job so wichtig ist, dass er zur Zeit von einem Menschen erledigt wird, versuchen Sie nicht, ihn mit KI zu automatisieren.

Bis zu einem gewissen Grad ist die KI-Software so aufgebaut, wie wir denken, dass unser Gehirn lernt. Aber es ist eine extreme Vereinfachung selbst des Wenigen, was wir über Gehirne wissen. Unser Gehirn ist jedem Algorithmus immer noch weit überlegen, wenn es um das Erlernen und Anwenden von Wissen geht.

Die KI mit einem menschlichen Gehirn zu vergleichen, ist wie ein Auto mit dem menschlichen Körper zu vergleichen: Wir betrachten Autos sicherlich nicht als Konkurrenz für unsere Körper. Sie können unter ganz bestimmten Umständen (lange Strecken von mehr oder weniger ebenem Boden) schneller zurücklegen, sind aber nicht besser darin sich zu Bewegen. Sie sind nur ein Werkzeug, das ein einziges Ding gut kann.

KI ist gut darin, Muster in gut geordneten Datensätzen zu finden, aber das ist es dann auch schon.

Die meisten menschlichen Jobs beinhalten Arbeit, in der KI nicht gut ist:

  • Wir beschäftigen uns ständig mit neuen Situationen.
  • Normalerweise tragen wir Informationen aus vielen verschiedenen Quellen zusammen. Die Inputfaktoren für unsere Arbeit werden nicht ordentlich quantifiziert und in Datenbanken erfasst.
  • Wir interagieren fortwährend mit anderen Menschen, die die Welt mehr oder weniger so sehen wie wir, und die wir verstehen können.

Als Faustregel gilt: Wenn eine Arbeit so wichtig ist, dass sie derzeit von einem Menschen erledigt wird, versuchen Sie nicht, sie mit KI zu automatisieren. Sie werden höchstwahrscheinlich scheitern.

Dagegen können Sie KI verwenden, um von Menschen geschriebene Regeln zu ersetzen. Verwenden Sie intelligente Automatisierung, um naive Automatisierung zu ersetzen.

Der Algorithmus ist nicht so wichtig

Über Erfolg oder Misserfolg entscheidet nicht der Algorithmus, sondern die Problemauswahl, die Datensätze und die Datenaufbereitung.

Algorithmen bekommen viel Aufmerksamkeit heute. Produkte, die die neuesten Arten von “Neuronalen Netzen” verwenden, sind angeblich überlegen. Aber die Wahrheit ist, dass der ROI Ihres maschinellen Lernprojekts nicht durch den Algorithmus bestimmt wird.

Was die Leistung Ihres Systems bestimmt, ist wie gut Sie das richtige Problem auswählen, welche Daten Sie einbeziehen und wie gut Sie Ihre Daten aufbereiten(siehe feature engineering).

Mehr als 80% des Aufwandes in einem maschinellen Lernprojekt fließen in diese Entscheidungen ein. Es wird nicht oft darüber gesprochen, aber es sind genau diese Entscheidungen, die über Erfolg oder Misserfolg entscheiden.

Nachdem Sie die richtigen Entscheidungen getroffen haben, wenn es um das Problem, die Daten und die Vorbereitung geht, können Sie etwas Zeit damit verbringen, einen sehr guten Algorithmus zu finden, und dann noch ein wenig Zeit damit, diesen Algorithmus zu optimieren.

Maschinelles Lernen ist kein “lernendes System”

Es es eine weit verbreitete Vorstellung, dass maschinelle Lernsysteme so konzipiert sind, dass sie aus Rückmeldungen lernen und sich im Laufe der Zeit verbessern. Dieses zunehmende Lernen soll das Geniale dabei sein, ähnlich einer aktiven Interaktion mit Nutzern, Märkten, etc.

Es ist eine attraktive Vorstellung, denn es klingt so, wie wir lernen. Aber so funktioniert maschinelles Lernen in der Praxis nicht. Das maschinelle Lernen erfordert eine große Anzahl von strukturierten Beispielen, an denen es lernen kann.

Zu einem späteren Zeitpunkt - vielleicht nach ein paar Wochen, wenn Sie mehr Daten gesammelt haben - können Sie das Modell erneut laufen lassen. Oder Sie können sogar jeden Tag ein neues Modell laufen lassen. Aber das sind kleine, inkrementelle Updates, die für das Ergebnis keinen großen Unterschied machen.

Das Wichtigste ist die große Menge an Daten, die Sie schon zu Beginn haben. Wenn Sie über diese Datenmenge nicht verfügen, können Sie KI nicht in Ihr Produkt einbauen.

TL;DR

Das maschinelle Lernen ist also ein großartiges Werkzeug, um komplexe Muster in Ihren großen Datensätzen zu finden und diese Muster dann für Vorhersagen zu verwenden.

Wenn Sie bereits einige automatisierte Entscheidungen in Ihrem Unternehmen verwenden, sollten Sie prüfen, ob Sie diese mit maschinellen Lernprogrammen exakter machen können.

Bekomme immer die neusten Artikel

Trag dich mit deiner E-Mail ein, um du bekommst jede Woche unseren neusten Artikel.

Ich danke Ihnen! Ihre Einreichung ist eingegangen!
Oops! Something went wrong while submitting the form.

Weiterlesen

No items found.
No blog posts found.