Algorithmen, mit denen Roboter ähnlich wie Menschen lernen können, haben Forscher an der University of California, Berkeley, entwickelt. Eine Maschine kann damit ohne spezielle Programmierung – nur durch Versuch und Irrtum – ganz unterschiedliche Tätigkeiten erlernen. Der Beispielroboter „BRETT“ hat sich so zwar bislang nur relativ einfache mechanische Tätigkeiten wie das Stapeln von Lego-Steinen angeeignet. Die Wissenschaftler sind aber überzeugt, dass in den kommenden Jahren Roboter mit dieser Methode auch deutlich komplexere Aufgaben erlernen können.
„Die Herausforderung beim Einsatz von Roboter in alltäglichen Umfeldern wie Eigenheimen oder Büros ist, dass sich dort die Umwelt ständig verändert“, so der Informatiker Trevor Darrell. Idealerweise sollten die Maschinen lernfähig genug sein, um sich ohne neue Programmierung auf veränderte Situationen einzustellen – ähnlich wie ein Mensch. Das Berkeley-Team setzt dazu auf „tiefes Lernen“, das sich das Gehirn zum Vorbild nimmt. Mit nur einem Algorithmus kann ein Roboter so durch Versuch und Irrtum lernen, wie unterschiedliche Aufgaben zu lösen sind.
Heranpunkten ans Ziel
Die Forscher haben ihren Ansatz mithilfe des Roboters BRETT (Berkeley Robot for the Elimination of Tedious Tasks) getestet. Dieser musste unterschiedliche Aufgaben bewältigen, darunter das Zuschrauben einer Thermoskanne, das Benutzen eines Schuhstreckers und das Stapeln von Lego-Steinen.
Der Lernalgorithmus nutzt dabei eine Funktion, die BRETT durch einen Punktewert anzeigt, wie zielführend eine versuchte Handlung war. Desto höher der Wert, desto näher ist der Roboter dem Ziel. Das erlaubt ihm, sich schrittweise an die richtige Lösung für eine Aufgabe heranzutasten.
Damit das funktioniert, muss der Roboter die Umgebung sowie seine Hände und Arme mittels Kamera-Auge sehen. Der Algorithmus liefert ihm dann dank der Punktefunktion laufend Echtzeit-Feedback. So lernt der Roboter sinnvolle Werte für 92.000 Parameter, mit denen er eine Aufgabe letztlich richtig bewältigen kann.
Wenn BRETT die Ausgangslage und die richtige Lösung kennt, dauert der Lernprozess etwa zehn Minuten. Muss er zusätzlich erst begreifen, wo sich notwendige Gegenstände befinden, braucht der Roboter zum Lernen ungefähr drei Stunden.
Großer Schritt, weiter Weg
Die Demonstration, dass der Lernalgorithmus funktioniert, ist laut Berkeley-Forschern ein wichtiger Schritt für die KI-Forschung. „Entscheidend ist, dass wir einen Roboter nicht umprogrammieren müssen, wenn er vor einem neuen Problem steht“, betont Informatikprofessor Pieter Abbeel. Denn ein und dieselbe Software reiche für alle Lernprozesse.
Für die kommenden Jahre rechnet Abbeel mit großen Fortschritten. „Mit mehr Daten kann man komplexere Dinge lernen“, erklärt er. Bis Roboter so weit sind, ganz allein das richtige Sortieren der Schmutzwäsche zu erlernen, wird es sicher noch dauern. Doch die Ergebnisse der Experimente mit BRETT stimmen den Informatiker optimistisch. „Innerhalb von fünf bis zehn Jahren könnten wir dank dieser Art der Forschung große Fortschritte bei der Lernfähigkeit von Robotern erleben.“