Der Sieg über den koreanischen Go-Meister Lee Sedol im März 2016 war für AlphaGo erst der Anfang. Wie der von Google kontrollierte Entwickler DeepMind jetzt mitteilte, hat das Programm im Internet unter den vielsagenden Pseudonymen «Master» und «Magister» in einer Woche 60 Gegner bezwungen. Zu den Opfern des AlphaGo-Updates gehörten dabei die weltbesten Profis des Strategiespiels.
Nach ihren Niederlagen räumen selbst ehemalige Skeptiker des Programms die überlegene Spielstärke von AlphaGo ein. Chinas bester Spieler Ke Jie hatte im Frühling noch behauptet, dass er AlphaGo locker geschlagen hätte. Nun hört man neue Töne vom Star: AlphaGo sei wie ein «Sturm», so Ke. «Wir Menschen haben Tausende Jahre Go geübt, doch nun zeigt uns ein Computer, dass wir alle falsch lagen.»
Tür zu einem riesigen Leerraum aufgestossen
Durch die Analyse der Spielweise von AlphaGo könnten Menschen ein völlig neues Level erreichen, glaubt Ke. «Ich danke AlphaGo, dass es die Go-Welt geschockt hat und hoffe, dass ein Mensch zumindest noch eine Partie gewinnen kann». Er habe während der Partie über die wahre Identität von Master Bescheid gewusst, erklärte Ke am Mittwoch.
Nie Weiping, ein weiterer Star der Szene, sieht das Spiel an einem historischen Wendepunkt. «Go ist weit komplexer, als wir es uns jemals vorstellen konnten.» Es sei nun an den Menschen, diesen riesigen Leerraum zu erforschen, zu dem AlphaGo die Tür aufgestossen habe, sagt Nie.
Heiliger Gral der künstlichen Intelligenz
Für den DeepMind Gründer und Chef Demis Hassabis hat das verbesserte AlphaGo die Testphase abgeschlossen und ist nun bereit für eine neue Runde offizieller Partien gegen menschliche Herausforderungen. «Lasst uns gemeinsam die tiefsten Geheimnisse des Spiels erkunden», schrieb Hassabis in einem Tweet.
Go galt lange Zeit als Heiliger Gral für die Technologie der künstlichen Intelligenz. Die Entwicklung von Computerprogrammen erwies sich als weitaus schwieriger als beim Schach und erst im Oktober 2015 gewann ein Vorläufer des heutigen AlphaGo ohne Vorgabe gegen einen starken menschlichen Spieler.
2,08 × 10170 gültige Spielpositionen
Ein Problem ist die unglaubliche Vielfalt der möglichen Züge. Auf dem normalen 19x19-Brett gibt es 2,08 × 10170 gültige Spielpositionen. Zum Vergleich: Im Schach sind nur etwa 1043 Züge möglich und selbst die Anzahl aller Atome im Universum (1080) ist nur ein winziger Bruchteil der möglichen Go-Züge.*
Doch die alle Vorstellungskraft sprengende Zahl der Go-Positionen ist nicht einmal die grösste Schwierigkeit. Viel problematischer ist für Computerprogramme die Entscheidung für den jeweils besten Zug. Bei AlphaGo wird die sogenannte Baumsuche – das Durchrechnen von Varianten bis zum möglichen Ende der Partie – mit Methoden des Deep Learning kombiniert.
«Gottähnliche» Spielstärke
Gelernt hat AlphaGo das Spiel durch die Analyse von 30 Millionen Spielzügen. Zum Zeitpunkt der Partie gegen den südkoreanischen Champion Lee Sedol gelang es dem Programm den nächsten Zug des menschlichen Gegners mit einer Wahrscheinlichkeit von 56 Prozent vorauszusagen. Doch AlphaGo verbessert sich mit jeder gespielten Partie.
Schon vor dem Showdown im letzten Frühling liessen die Entwickler das Programm monatelang gegen sich selbst spielen. AlphaGo entwickelte dabei einen beinahe unschlagbaren Spielstil, was sich im Endresultat von 4 zu 1 gegen den Menschen ausdrückte. Der koreanische Verband verlieh dem Programm darauf den Rang 9p eines 9. professionellen Dan, was einer «gottähnlichen» Spielstärke entspricht.
Kleine Schwächen im Frühling
Obwohl AlphaGo gezeigt hat, dass Computergehirne beziehungsweise künstliche neuronale Netze mit den richtigen Lernmethoden trainiert das menschliche Gehirn in Teilbereichen bei Weitem übertreffen können, bedeutet dies noch nicht den endgültigen Sieg der Maschinen über die Menschen. Die «Denkweise» von AlphaGo unterscheidet sich grundlegend von der des Menschen.
Lee Sedol war im Frühling aufgefallen, dass AlphaGo mit sehr ungewöhnlichen Zügen zu Fehlern gezwungen werden kann. Weil das Programm einen konservativen oder defensiven Spielstil pflegt, erholt es sich schlecht von Fehlern, was ihm in der verlorenen Partie zum Verhängnis wurde. Zudem sei AlphaGo mit schwarzen Steinen schwächer, weil es die Partie eröffnen müsse, sagte Lee.
Einsatz in der Medizin
Dennoch wird selbstlernenden Computern wie AlphaGo eine grosse Zukunft vorausgesagt, beispielsweise in der Medizin. Zum Start möchte die Entwicklerfirma DeepMind in einem Forschungsprojekt auf Augenscans nach Krankheiten suchen.
*Wenn es so viele Universen gäbe, wie das Universum Atome hat, gäbe es in all diesen Universen immer noch weniger Atome als gültige Go-Spielzüge existieren.