KI leicht erklärt – Teil 2: Von klassischer KI, Neuronalen Netzen und Deep Learning

Lesezeit ca. 10 Minuten: Die Künstliche Intelligenz (KI) ist so alt wie die Informatik selbst. Rechnen, das Ziehen logischer Schlüsse, das Durchführen komplexer Anweisungen… all das war vor der Erfindung des Computers dem Menschen vorbehalten. Schon die Leistungen der (aus heutiger Sicht) primitiven ersten Computer erschienen den Zeitgenossen wie das Nachahmen des menschlichen Geistes und […]

Lesezeit ca. 10 Minuten:
Die Künstliche Intelligenz (KI) ist so alt wie die Informatik selbst. Rechnen, das Ziehen logischer Schlüsse, das Durchführen komplexer Anweisungen… all das war vor der Erfindung des Computers dem Menschen vorbehalten. Schon die Leistungen der (aus heutiger Sicht) primitiven ersten Computer erschienen den Zeitgenossen wie das Nachahmen des menschlichen Geistes und seiner Leistungen. Es ist also nicht verwunderlich, dass auch Alan Turing, einer der Begründer der Informatik, sich intensiv mit der Frage beschäftigte, was KI ist – obwohl es den Begriff damals noch gar nicht gab. Mit dem Turing Test versuchte er sich an einer ersten Definition für KI. Im ersten Teil dieser Serie haben wir uns bemüht, eine tragfähige Definition für KI zu finden und dazu eine Matrix von Definition aus einem Standardwerk der KI übernommen:

menschlich rational
Denken I. Es denkt wie ein Mensch II. Es denkt rational
Handeln III. Es verhält sich wie ein Mensch IV. Es verhält sich rational

Starke vs. schwache KI

Im letzten Artikel haben wir aber nicht nur eine Definition für KI Systeme etabliert, sondern auch festgestellt, dass sich die Wahrnehmung von KI kontinuierlich verändert: Als Kasparov 1997 gegen Deep Blue verlor, galt dies als ein Triumph der KI. Und tatsächlich erfüllte der Schachcomputer die Voraussetzungen II und IV unserer Definition mit Bravour: Das „Denken“ des Programms ist vollkommen rational und es „verhält“ sich ebenfalls komplett rational, d.h. es führt die Züge aus, die nach dem Wissensstand des Systems die größte Gewinnwahrscheinlichkeit versprechen. Wir sind mittlerweile aber an Schachprogramme, die übermenschlich gut spielen, dermaßen gewöhnt, dass diese oft nicht mehr als KI wahrgenommen werden. Wir wissen, dass das Programm lediglich mittels einer Rechenleistung alle “Szenarien” berechnet und dementsprechend agiert.

Sprechen Öffentlichkeit und Medien dagegen heutzutage über KI, hat das mit den Schachprogrammen der Vergangenheit nichts mehr zu tun. Unter KI versteht die breite Öffentlichkeit in der Regel eine “starke KI” (strong AI) und befeuert Vorstellungen, Erwartungen und Ängste, die völlig irreführend sind, denn bei sämtlichen aktuellen KI Systemen handelt es sich um „schwache“ oder „spezialisierte“ KI. Doch was ist eigentlich der Unterschied zwischen “starker” und “schwacher” KI?

Unterschiede zwischen starker und schwacher KI

Starke KI kennen wir, zugespitzt gesagt, aus Science-Fiction Filmen: Sie ist mindestens so intelligent wie ein Mensch (oder diesem überlegen), verfügt über ein Bewusstsein ihrer selbst und ist in der Lage, in natürlicher Sprache zu kommunizieren. Außerdem ist sie mit „Weltwissen“ ausgestattet, d.h. mit einem Verständnis dafür, wie die echte Welt auf physikalischer, biologischer, aber auch sozialer Ebene funktioniert.

Eine spezialisierte oder schwache KI, wie etwa ein Schachcomputer, eine moderne Bilderkennung oder auch Siri, ist dagegen immer ein „Fachidiot“: Sie kann genau eine Aufgabe durchführen, manchmal sogar mit übermenschlicher Leistung, ist darüber hinaus aber unglaublich eingeschränkt. Ein Schachcomputer kann nicht einmal Tic-Tac-Toe spielen. Er weiß nicht, was Schach ist, wie Figuren aussehen oder warum man Schach spielt. Dies gilt auch für die modernste Bilderkennung aus dem Silicon Valley: Sie weiß nicht, was Hunde und Katzen sind, auch wenn sie sie auf Bildern “erkennen” kann. Sie hat keine Idee von Oben und Unten, weiß nicht, was Beine oder Fell sind. Sie kann lediglich komplexe Muster aus Bildern filtern und statistisch gewichtet einordnen. Auch Chatbots, Alexa, Siri & Co. sind nur Potemkinsche Dörfer: Mit viel Fleiß und Tricks werden menschliches Verhalten und Verständnis vorgetäuscht. Sobald man aber nur einen Zeh über die vordefinierten Grenzen setzt, sind die Systeme hilflos.

Starke KI Schwache KI
komplexes physikalisches, biologisches und soziales Weltwissen gar kein Wissen oder enorm spezifisches, datenbankartiges Wissen
Ich-Gefühl, Reflexionsfähigkeit keinerlei Bewusstsein ihrer selbst
Wissenstransfer: Erlerntes kann auf ähnliche Tätigkeiten übertragen werden Kann nur eine (oder sehr wenige) Aufgaben lösen
Permanent lernend und sich anpassend Lernen (bzw. Programmierung) und Anwendung strikt getrennt
Science Fiction Aktueller Stand der Technik

Sind neuronale Netze und Deep Learning “starke KI”?

Wenn wir in den nächsten Artikeln also näher auf die Funktionsweise von diversen KI Systemen eingehen, geht es stets um den tatsächlichen Forschungsstand und somit durchweg um “schwache” KI. Auch wenn z.B. neuronale Netze menschliches Verhalten “vortäuschen” können, haben wir es nicht mit einer starken KI zu tun. Neuronale Netze und Deep Learning erzeugen, trotz aller medialen Aufmerksamkeit, keine künstlichen Gehirne. Sie sind nicht „besser“ als die Verfahren, mit denen man bisher Schachcomputer gebaut hat. Sie funktionieren schlicht anders und erschließen neue Möglichkeiten der Digitalisierung. Aber was ist denn jetzt im aktuellen KI Hype überhaupt neu?

Abgrenzung zwischen klassischer KI, Machine Learning, Deep Learning und Neuronalen Netzen (NN)

Die erwähnten Schachprogramme und ähnlich aufgebauten KI Systeme bezeichnet man mittlerweile als „klassische“ KI, alternativ auch als symbolische KI. Ausgehend von einem Top-Down-Ansatz wird versucht, ein Problem und seine Teile mit Symbolen, Regeln und Repräsentationen deterministisch zu beschreiben.

Der unterschiedliche Ansatz von Deep Learning

Auf einem anderen Ansatz basiert das „Deep Learning“, welches derzeit für Schlagzeilen sorgt und es ermöglicht, einen Computer Dinge tun zu lassen, die bisher Menschen vorbehalten schienen. Das Deep Learning ist ein Spezialfall des maschinellen Lernens (Machine Learning) und arbeitet nach dem Bottom-Up-Prinzip: Der Algorithmus versucht in diesem Fall, ein Problem stochastisch auf niedriger Ebene zu beschreiben, in der Hoffnung, dass sich hieraus nützliche Repräsentationen ergeben. Das ist das Prinzip der meisten Machine Learning Verfahren. Beim Deep Learning geschieht dies mittels neuronaler Netze (NN), die aus besonders vielen Schichten bestehen und daher „tief“ sind. Heutzutage kann man Deep Learning synonym mit künstlichen neuronalen Netzen benutzen, was wir ebenfalls tun werden.

In den vergangenen Jahren haben wir uns an die klassische KI gewöhnt, deren Funktionsweise auch leichter nachzuvollziehen ist als die der neuronalen Netze. Während neuronale Netze und ihre Ergebnisse noch fast “magisch” und somit wie eine “richtige” KI anmuten, erscheint uns die klassische KI heutzutage beinahe alltäglich. Dabei muss man betonen: Klassische KI ist nicht “dümmer” oder weniger „echt“ als neuronale Netze. Sie basiert lediglich auf anderen Paradigmen als neuronale Netze und hat dementsprechend andere Vor- und Nachteile. Interessanterweise ist klassische KI auch nicht wesentlich älter, denn auch die ersten neuronalen Netze gab es schon Ende der fünfziger Jahre.

Wie funktioniert eine klassische KI?

Um zu verstehen, wie genau klassische KI funktioniert, kehren wir kurz zum Beispiel des Schachcomputers zurück. Für die ersten Züge des Spiels greift das Programm auf eine Datenbank mit (unzähligen) vorbereiteten Stellungen zu und wählt den jeweils “richtigen” Zug. Kann hier keine Lösung mehr gefunden werden, probiert eine Schach-KI (im Hintergrund) Millionen von Zugkombinationen aus und schaut, was das Ergebnis sein wird.

Wie funktioniert Deep Learning?

Ein gutes Beispiel für ein Deep Learning System hingegen ist ein Programm zur Bilderkennung: Es wird zunächst mit Tausenden Bildern und der Information gefüttert, welcher Objektklasse (z.B. Hund oder Katze) das jeweilige Bild zufällt. Mithilfe eines speziellen Lernalgorithmus werden die Millionen Parameter dieses geschichteten Systems schrittweise angepasst, bis es die erwarteten Ergebnisse liefert. Allerdings lässt sich nur schwer sagen, wie genau die Entscheidungsfindung stattfindet. Mit aufwändigen Visualisierungen kann man eine gewisse Intuition entwickeln, wie einzelne Schichten auf immer komplexere Bildmerkmale reagieren, aber es gibt keine klar abgegrenzte, nachvollziehbare Entscheidungsfindung – ein neuronales Netz hat oft mehr von einem Künstlichen Reflex als von einer künstlichen Intelligenz.

Unterscheidung und Kombination verschiedener KI-Ansätze

Die KI ist ein weites Feld – oft kommt es in erster Linie darauf an, wie ein Algorithmus oder eine Programmiertechnik eingesetzt werden, um zu entscheiden, ob sie als KI bezeichnet werden können. Ausgehend von unseren Beobachtungen können wir das gesamte Gebiet der KI wie folgt aufteilen:

KI Technologien von schwachen und starken KIs
KI Beispiele von starken und schwachen KIs

Wichtig ist, dass keines der Verfahren „echter“ oder “richtiger” ist als ein anderes. Die unterschiedlichen Methoden haben spezifische Stärken und Schwächen, die sie für verschiedene Einsatzgebiete prädestinieren. Für erfolgreiche Anwendungen werden heutzutage meist Techniken aus klassischer KI, neuronalen Netzen und Machine Learning miteinander kombiniert. Auch gehört nicht jeder Algorithmus exklusiv zu einem Lager: Es gibt Verfahren, die Eigenschaften aus beiden Denkrichtungen aufweisen.

Ist die klassische KI „falsch“ und neuronale Netze „richtig“?

Die Frage ist müßig, denn es sind schlicht zwei verschiedene Ansätze, die das gleiche Problem zu lösen versuchen. Manchmal funktioniert der eine Ansatz, manchmal der andere besser. Verfahren der klassischen KI haben zugegebenermaßen lange mehr Beachtung bekommen, weil sie einfach bessere Ergebnisse lieferten. Weil sie früher mehr Erfolg zeigten, nennen wir sie heute oft „klassisch“. Neuronale Netze waren bis vor wenigen Jahren nicht so erfolgreich, weil es an Rechenleistung, Daten und algorithmischen Erkenntnissen für das richtige Training mangelte. Zudem unterliegt auch die KI Forschung Strömungen und Trends. Lange Zeit waren neuronale Netze einfach als interessantes, aber nutzloses Kuriosum verpönt und fristeten ein Schattendasein.

Mit dem aufkommenden Internet und damit immer größeren verfügbaren Datenmengen gewannen Machine Learning Verfahren, zu denen auch die neuronalen Netzwerke zählen,  seit den späten neunziger Jahren zunehmend an Bedeutung, was in einem ersten „Big Data“-Boom mündete. Die zunächst dominierenden Machine Learning Verfahren wie Support Vector Machines (SVM) wurden dann schließlich von Deep Learning teilweise abgelöst. Diese sind zur Zeit in aller Munde, weil sie Probleme lösen können, die Computern bisher verschlossen waren.

Da die meisten erfolgreichen KI Anwendungen aber verschiedene Komponenten kombinieren, ist es zunächst einmal wichtig, die grundlegenden Methoden im Einzelnen zu kennen, bevor man auf aktuelle Entwicklungen eingeht. Deswegen wird der nächste Artikel eine Reihe von Verfahren der klassischen oder symbolischen KI betrachten und erklären, inwiefern sie schon nützlich zur Erzeugung von „intelligentem“ Verhalten sein können.