Was ist Machine Learning?

Machine Learning beschreibt die faszinierende Idee, dass von Menschen geschaffene Maschinen selber lernen können. Dadurch erweitern sie ihre Funktionalität und entwickeln eine künstliche Intelligenz (KI). Diese erlaubt es, dass eine trainierte Maschine sich auf geänderte Bedingungen einstellen kann. Sie ist dann nicht mehr abhängig von durch Menschen vorprogrammierte Abläufe.

Was versteht man unter künstlicher Intelligenz?

Künstliche Intelligenz begegnet einem unter diesem Begriff häufig bei Computerspielen. Das Verhalten eines maschinellen Gegners, der KI, beschränkt sich dort nicht zwingend auf bestimmte Muster. Vielmehr ist ein Rahmen vorgegeben, in dem sich die vom Rechner gesteuerte Figur bewegt. Anstatt mögliche Verhalten und darauffolgende Reaktionen zu programmieren, wird ein Algorithmus entwickelt, der Muster erkennt und verarbeitet.

Ist dieser gut gemacht, hat es den Anschein, dass die Figur eigene Gedanken entwickelt und dementsprechend handelt. Insbesondere wird die Maschine dadurch unempfindlicher gegenüber nicht vorgesehenen Eingaben. Anstatt den Vorgang abzubrechen oder „abzustürzen“, vergleicht sie mit ihr bekannten Daten und handelt entsprechend.

Hier besteht eine Analogie zum Verhalten und zur Intelligenz eines Menschen. Dieser versucht, in unbekannten Situationen Vergleiche mit ihm bekannten Verhältnissen herzustellen. Er handelt nach ihm vertrauten, erlernten Verhaltensmustern.

Die Rolle von Machine Learning in der KI

Das Machine Learning ist die Basis für jede KI. Man spricht davon, dass die Maschine trainiert werden muss. Sie benötigt eine ausreichend große Anzahl an Vergleichsdaten, um eine Grundlage für die „richtigen“ Entscheidungen zu haben. Eine untrainierte Maschine wird häufig unlogische und offensichtlich falsche Entscheidungen treffen. Man kann dies ebenfalls leicht mit dem Erfahrungsschatz eines Menschen vergleichen. Ein Kind, welches vor Kurzem erst das Lesen gelernt hat, wird die leicht unleserliche Handschrift eines Fremden nicht deuten können. Ein erfahrener Apotheker, der jahrzehntelang unleserliche handgeschriebene Rezepte von Ärzten entziffern musste, wird damit keine Probleme haben.

Es müssen also Voraussetzungen für Machine Learning geschaffen werden. Dazu benötigt sie die Fähigkeit, ihre „Erfahrungen“ abzuspeichern. Zudem ist ein Algorithmus erforderlich, der Situationen klassifiziert und strukturiert ablegt.

Details zu Machine Learning

Es gibt zwei unterschiedliche Ansätze des Machine Learning. Das symbolische und das nicht-symbolische Lernen.

Beim symbolischen Ansatz erfolgt eine explizite Repräsentation von Werten. Objekten werden Eigenschaften zugeschrieben, die äußerlich nachvollziehbar sind. Das können Größen, Farbe oder bestimmte Formen sein. Es kann festgelegt werden, dass die Größe eines zu klassifizierenden Objekts sich in einem bestimmten Bereich bewegen muss. Dies kann mit einer Aussagelogik verbunden werden.

Diese besagt beispielsweise, wenn Objekt A größer als Wert X und kleiner als Wert Y ist, kann es nicht eines der Kategorie Z sein. Verknüpft man ausreichend viele solcher Aussagen, wird man schon recht zufriedenstellende Ergebnisse bekommen.

Voraussetzung für diese Form des Machine Learning bleibt, dass die Maschine auf eine entsprechend große Datenmenge zur Klassifizierung zurückgreifen kann. Es müssen ihr ausreichend viele Ausprägungen möglicher Kandidaten für eine Kategorie „gezeigt“ werden. Ansonsten ist die Gefahr groß, dass es zu falschen Mustererkennungen kommt.

Der nicht-symbolische Ansatz des Machine Learning

Der nicht-symbolische Ansatz des Machine Learning baut stärker auf Verknüpfungen auf. Eine Ausprägung hiervon sind neuronale Netze. Es existiert kein Schema, nach dem Eingabewerte zu einem zugewiesenen Ausgangswert führen.

Die Eigenschaften werden vielmehr in verschiedenen Schichten aufgenommen, vom Objekt extrahiert und pro Schicht nach einem Algorithmus weiterverarbeitet.

Dieser kann mit einer Wahrscheinlichkeit arbeiten. Bei einem Personenkraftwagen gibt die Farbe vermutlich keinen Aufschluss über den Fahrzeugtyp. Bei der Bewertung von Sonderkraftwagen wäre hingegen die Farbe „rot“ ein starkes Indiz, dass es sich um ein Feuerwehrfahrzeug handelt. Kehrt man diese Aussage um, wäre es fast sicher, dass ein nicht-rotes Fahrzeug keines der Feuerwehr ist.

Je mehr Schichten existieren, die versuchen, derartige Verknüpfungen herzustellen, desto präziser wird das Ergebnis des Machine Learning.

Zudem kann Machine Learning nach der Art des Lernens unterschieden werden. Beim überwachten Lernen, werden der Maschine Eingaben mit den dazugehörigen Ausgaben zugeführt. Daraus bildet die Maschine Muster, die sie später anwenden kann.

Beim unüberwachten Lernen erhält die Maschine nur die Objekte. Sie bildet selber sinnvolle Kategorien und ordnet die Objekte diesen zu.

Die Anwendungsbereiche von Machine Learning

Das Machine Learning hat vermutlich auch in Ihrem Alltag Einzug erhalten. Ein einfaches Beispiel sind Apps von Online-Versandhäusern oder Streaming-Diensten. Bestellen Sie regelmäßig Artikel aus einer bestimmten Kategorie, werden Sie vermehrt Angebote aus diesem Bereich auf ihrem Startbildschirm finden. Die von Ihnen bevorzugt gehörte Musik wird in Kategorien erfasst und sie bekommen Songs ähnlicher Interpreten angeboten.

Sehr gut zu verwenden ist Machine Learning für künstliche Intelligenz, die etwas genormtes, wie betriebliche Schreiben, klassifizieren soll. So gibt es Formulierungen, die Rechnungen eindeutig von Werbeschreiben unterscheiden. Für das Dokumentenmanagementsystem (DMS) von docurex® wird ebenfalls eine leistungsstarke KI entwickelt, die nach diesem Prinzip lernt.

Grenzen und Schwächen

Im Moment hängt der Erfolg des Machine Learning noch sehr stark von der Möglichkeit ab, aussagekräftige Trainingsdaten zu haben. Was für Dokumente sehr einfach ist, gestaltet sich beispielsweise in der Medizin schon schwieriger. Ein weiterer Faktor, der durch Machine Learning schlecht imitiert werden kann, ist die menschliche Fantasie. Diese beeinflusst dessen Fähigkeit zur Problemlösung nicht unerheblich.