Nur mit Bleistift, Papier und Pappbechern kannst du dir eine eigene KI für das Spiel Nim bauen. Trainiere sie, indem du gegen sie spielst, und sie wird unschlagbar gut. Und das alles ohne Computer!
Nim ist ein altes Spiel mit unzähligen Variationen. Hier benutzen wir folgende einfache Version: Lege zehn Stifte (Münzen, Knöpfe, o.ä.) in einer Reihe auf den Tisch. Zwei Spieler*innen nehmen pro Zug entweder ein, zwei oder drei Stifte vom Tisch. Wer den letzten Stift nimmt, hat verloren.
Um eine KI zu basteln, die Nim spielen kann, brauchst du neun Becher in einer Reihe, die mit den Zahlen 10 bis 2 beschriftet werden. Dann schneidest du drei Zettel mit ungefähr derselben Größe aus und beschriftest sie mit den Zahlen 1, 2 und 3. Du faltest die Zettel und legst sie in den Becher mit der Zahl 10. Das machst du so lange weiter, bis in jedem Becher drei Zettel mit den Zahlen 1, 2 und 3 sind, nur der letzte Becher (mit der Zahl 2) braucht nur zwei Papierstücke (mit den Zahlen 1 und 2).
Ab sofort kann deine KI gegen dich Nim spielen. Entscheide, wer den ersten Zug hat. Wenn die KI am Zug ist, zähle die Stifte, die noch auf dem Tisch liegen, und nimm den Becher mit der entsprechenden Zahl. Wähle einen beliebigen Zettel aus dem Becher - die Zahl auf dem Zettel bezeichnet die Anzahl an Stiften, die die KI wegnimmt. Lege danach den Zettel zurück in den Becher.
Auf diese Weise kann die KI mit deiner Hilfe eine Spielentscheidung treffen. Ihre Züge entsprechen immer den Spielregeln, sind aber gänzlich zufällig. Sie sollte daher einfach zu schlagen sein. Denn manchmal macht die KI sehr schlechte Entscheidungen: Sie nimmt etwa alle drei Stifte weg, wenn nur noch drei übrig sind. Um sie unbesiegbar zu machen, müssen wir die KI also trainieren!
Überlasse der KI den ersten Spielzug. Wenn du nun einen Spielzug der KI ausführst, lege jeden Zettel neben dem Becher, aus dem er stammt. Nach Spielende führe folgende Aktionen aus:
Wiederhole diesen Vorgang bis in jedem Becher nur noch ein Zettel liegt: Nun kennt die KI in jeder Spielsituation den besten Spielzug. Sie hat ihren Lernvorgang abgeschlossen und gewinnt immer, wenn sie den ersten Spielzug hat. Ist sie als zweites an der Reihe, musst du perfekt spielen, um gegen sie zu gewinnen. Probiere es mit anderen Leuten aus, die weniger Spielerfahrung haben als du, oder versuche, deine Freundinnen, Freunde oder Familie zu überraschen!
Auch wenn du keine Elektronik verwendet hast - häufig trainiert man computerbasierte KI in einer ähnlichen Weise: langsames Lernen durch einen gesteuerten Kreislauf von Wiederholungen und Feedback, um schlechte Resultate zu verhindern. Dieser Prozess kommt nicht nur bei Spielen zur Anwendung, sondern bei KI-Systemen allgemein.
Schon vor dem Lernprozess besitzt eine KI bereits alle notwendigen Komponenten für die Spielentscheidungen (in unserem Fall sind das die Zettel und Becher), allerdings noch kein “Wissen”, nach dem sie handelt. Eine KI zu bauen und eine KI zu trainieren, sind zwei verschiedene Sachen. Häufig erreichen KI-Systeme für komplexere Aufgaben nicht den vollständig trainierten Zustand deiner KI. Sie sind aber trotzdem gut genug, um außerhalb des Labors reale Arbeit zu übernehmen. In manchen Fällen lernen sie dann in der Realität einfach weiter.
Dieselbe Methode funktioniert auch für Künstliche Intelligenzen anderer Spiele. Unsere Nim-Version verfügt über neun verschiedene “Zustände” (bei uns: Becher) mit drei unterschiedlichen Spielzügen (bei uns: Zettel). Die meisten andere Spiele besitzen mehr Zustände und Spielzüge und benötigen deshalb einen komplexeren Aufbau.
Der Wissenschaftler Donald Michie erfand 1961 eine KI mit 304 Streichholzschachteln und vielen Perlen mit unterschiedlichen Farben, die Tic Tac Toe spielen konnte. Er gab ihr den Namen MENACE und sie funktionierte prinzipiell so wie unsere Nim-KI. Nur verwarf MENACE nicht nur die Perlen bei schlechten Strategien, sondern verstärkte sich mit neuen Perlen bei guten Strategien, um diese Spielzüge in Zukunft wahrscheinlicher zu machen.
2017 machte ein Nachbau von MENACE beim Manchester Science Festival auf sich aufmerksam. Nach kurzer Zeit gelang es der KI, in jedem Spiel gegen die Besucher*innen entweder zu gewinnen oder zumindest unentschieden zu spielen:
Beim Spielen von Nim hast du vielleicht selbst eine gute Strategie durch logische Schlussfolgerungen entdeckt. Du bist dabei wahrscheinlich nicht alle schlechten Züge einzeln durchgegangen. Vielleicht hast du auch das Muster der übrig gebliebenen Zahlen auf den Zetteln der vollständig trainierten KI durchschaut? Menschen können schlussfolgern und abstrahieren, um so Muster zu finden und Probleme zu lösen. Computer werden oft nur genutzt, um kurze und sich wiederholende Aufgaben schnell zu lösen.
Spiele wie Go oder Schach verfügen über einen so hohen Grad an Komplexität, dass bisher kein Mensch eine Strategie gefunden hat, die immer gewinnt. Sie besitzen so viele Zustände, dass auch Computer auf Probleme stoßen, sie zu berechnen. Nach groben Schätzungen brauchen wir fast 1050 Becher (1050 ist eine 1 gefolgt von 50 Nullen, ungefähr die Anzahl aller Atome auf der Erde), um einer KI Schach auf diese Weise beizubringen. Diese Spiele benötigen, genauso wie alle Probleme von höherer Komplexität, andere KI-Methoden, die gute Lösungsstrategien durch Muster und Regeln finden, ohne erst einmal alle Zustände durchgehen zu müssen (wie z.B. Neuronale Netze).
Im Exponat Turing Game Table verwenden wir eine komplexere Version von Nim. Außerdem übernimmt ein Mensch die Rolle der KI. So erlebt er, wie Computer Aufgaben ausführen, ohne dabei die Regeln des Spiels zu kennen oder das Spiel zu verstehen.
Mehr über den Besuch der Ausstellung.
Der Text ist unter der Lizenz Creative Commons Attribution License verfügbar.