Stelle zu gelangen. Nach dem Prozess des Metalernens
erkannte der Roboter, dass er bei jeder Aufgabe rennen
musste. Danach stellte sich ihm bloß noch die Frage, in
welche Richtung er losflitzen sollte. Um sich bestmöglich
auf einen Befehl vorzubereiten, rannte der Roboter daher an
Ort und Stelle. »Das macht es für ihn einfacher, vorwärts
oder rückwärts loszusprinten«, sagt Finn.
Die neue Methode scheint also in der wirklichen Welt zu
funktionieren. Dennoch birgt sie auch Nachteile: Man
braucht zwar nur wenige Daten, um einem bereits optimier-
ten Algorithmus eine bestimmte Fertigkeit beizubringen,
trotzdem sind insgesamt enorme Datenmengen für den
Metalerner nötig, der das Lerner-Netzwerk trainiert. Zudem
ist der Ansatz extrem rechenintensiv, weil die Algorithmen
die teilweise sehr feinen Unterschiede zwischen den ver-
schiedenen Aufgaben erkennen müssen. »Selbst wenn
neuronale Netze in den letzten Jahren große Fortschritte
gemacht haben, sind sie noch weit davon entfernt, wie
Menschen zu lernen«, erklärt der Kognitionswissenschaftler
Brenden Lake von der New York University.
Gegnerische Netzwerke
Metalernen ist nicht der einzige Ansatz, bei dem Forscher
neuronale Netze nutzen, um diese selbst zu verbessern.
Tatsächlich kann ein Algorithmus ein Netzwerk darauf
trainieren, zwei durch und durch menschliche Züge zu ent-
wickeln: Kreativität und Fantasie (siehe Spektrum Mai 2019,
S. 68). Das zeigte sich in einer Flut von Porträtfotos, die in
den letzten Jahren das Internet überschwemmten. Das
Überraschende an ihnen ist: Die abgebildeten Menschen
haben niemals existiert. Sie sind das Produkt einer neuen
Technologie mit einer ausgeklügelten Art von Fantasie.
Überraschenderweise lässt sich die menschliche Vorstel-
lungskraft nämlich recht einfach automatisieren. Dazu muss
man bloß ein gewöhnliches Bilderkennungsprogramm, ein
so genanntes diskriminierendes neuronales Netz, rück-
wärtslaufen lassen. Dadurch wird es zu einem »generati-
ven« Netzwerk, das Bilder erzeugt. Während man einem
Diskriminator Bilder übergibt, die er daraufhin benennt oder
beschreibt, funktioniert ein Generator genau andersherum:
Aus einer Bezeichnung kreiert er eigenständig Bilder. Der
Vorgang ist allerdings recht aufwändig. Immerhin muss
man irgendwie sicherstellen, dass das Netzwerk ein sinnvol-
les Ergebnis produziert. Übergibt man ihm beispielsweise
den Begriff »Dobermann«, dann sollte es erkennbar einen
solchen Hund zeichnen. Doch wie trainiert man einen
Generator darauf, derartige Aufgaben zu erfüllen?
Als sich Ian J. Goodfellow, heute bei Google Brain in
Mountain View, Kalifornien, während seiner Doktorarbeit
mit dieser Frage beschäftigte, kam ihm 2014 die Idee,
generative Netzwerke durch einen Diskriminator zu trainie-
ren. Wenn man daher das Bild eines Dobermanns erzeugen
»Generative adversarial networks«
Man kann ein klassifizierendes Netzwerk auch rückwärts ablaufen lassen,
so dass es beispielsweise realistische Bilder von Katzen erzeugt, die
niemals existiert haben. Wissenschaftler trainieren diese »generativen
Netzwerke« durch gewöhnliche Klassifizierer (so genannte Diskriminato-
ren), die bewerten, wie wirklichkeitsnah die KI-Bilder sind. Zusätzlich
fügen sie dem System zufälliges Rauschen hinzu, um sicherzustellen,
dass jede Katze einzigartig ist.
Netzwerke im Tandem
Um einem Programm beizubringen, die Objekte
einer Szene zu identifizieren, braucht man zwei
Netzwerke. Das eine (im blauen Bild links) kompri-
miert die übergebenen Daten, während das andere
(rechts) sie wieder dekomprimiert. Je weniger man
die Daten komprimiert, desto präziser wird die
Beschreibung des Bilds.
Training
Dem Diskrimina-
tor wird zufällig
entweder ein
echtes oder ein
generiertes
Katzenbild
gezeigt.
Diskriminator
echt
gefälscht
Der Diskriminator
beurteilt, ob das Bild
echt ist. Falls er zu
einem negativen
Ergebnis kommt, teilt er
dem Generator mit, was
Generator ihn am Bild gestört hat.
gefälschtes
Katzenbild
Ergebnis: Fähigkeit, ein realistisches Katzenbild zu erzeugen
Input: zufälliges
Rauschen und eine
Bezeichnung
Katze
Training
Input: einfache Elemente mit
mehreren Freiheitsgraden
Ergebnis: Fähigkeit, einzelne Elemente zu
identifizieren und zu rekonstruieren
Programm wird immer weniger eingeschränkt.
Rauschen
BROWN BIRD DESIGN / SCIENTIFIC AMERICAN MAI 2019