“RialTo” des MIT

Haushaltsroboter lernen im digitalen Zuhause

Uhr
von Alexandra Hüsler und yzu

Forschende des MIT trainieren Haushaltsroboter mit "RialTo" in einer virtuellen, dreidimensionalen Kopie einer Wohnung. Das Training mit der Software ermöglicht es Robotern, sich schneller und effizienter an neue Umgebungen und Herausforderungen anzupassen und Aufgaben wie das Öffnen von Türen oder das Greifen von Objekten präzise auszuführen.

Marcel Torne Villasevil (links) und Pulkit Agrawal im MIT-Labor mit einem Versuchsroboter. (Source: Mike Grimmett / MIT CSAIL)
Marcel Torne Villasevil (links) und Pulkit Agrawal im MIT-Labor mit einem Versuchsroboter. (Source: Mike Grimmett / MIT CSAIL)

Die Forschenden des MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) haben mit der Software "RialTo" einen neuen Ansatz entwickelt, um Haushaltsroboter noch präziser und anpassungsfähiger zu machen. Mithilfe einer digitalen Kopie der eigenen Wohnung, einem sogenannten "digitalen Zwilling", soll ein Roboter in einer simulierten Umgebung trainiert werden, bevor er in der realen Welt eingesetzt wird, wie das Institut schreibt.

Digitale Zwillinge

"Unser Ziel ist es, dass Roboter bei Störungen, Ablenkungen, wechselnden Lichtverhältnissen und Änderungen der Objektpositionen aussergewöhnlich gut funktionieren, und das alles in einer einzigen Umgebung", sagt Marcel Torne Villasevil, MIT CSAIL-Forschungsassistent im Improbable AI-Labor. So soll man mit einem Smartphone die eigene Wohnung mit Tools wie "NeRFStudio", "ARCode" oder "Polycam" scannen und in ein detailliertes 3D-Modell umwandeln können.

Dieser digitale Zwilling werde dann an einen Computer übertragen. Der Roboter trainiert dann in der virtuellen Umgebung und lernt, Objekte zu greifen, Türen zu öffnen oder einfach nur durch die Räume zu navigieren. Das Besondere daran sei, dass die Bewegungen und Handlungen des Roboters nicht zufällig generiert werden. Sie basieren auf realen Demonstrationen und Umgebungen. So muss der Mensch dem Roboter nur einmal zeigen, wie eine Aufgabe ausgeführt wird und der Roboter übt diese dann in der Simulation immer wieder.

Verbesserung gegenüber dem "Imitationslernen"

Durch das Training in der Simulation kann der Roboter viel schneller und effizienter lernen als in der realen Welt. Für jede Aufgabe testeten die Forscher die Leistung des Systems unter drei ansteigenden Schwierigkeitsgraden: zufällige Anordnung der Objekte, Hinzufügen von visuellen Ablenkungen und physische Störungen während der Ausführung der Aufgabe. In Verbindung mit realen Daten zeigte das System bessere Leistungen als mit herkömmlichen Immitationemethoden, insbesondere in Situationen mit vielen visuellen Ablenkungen oder physischen Unterbrechungen.

Die Tests hätten zudem gezeigt, dass "RialTo" starke Richtlinien für eine Vielzahl von Aufgaben erstellt, sowohl in kontrollierten Laborumgebungen als auch in unberechenbaren realen Umgebungen, und dabei eine Verbesserung von 67 Prozent gegenüber dem Imitationslernen mit der gleichen Anzahl von Demonstrationen erzielt, heisst es weiter.

So konnte der mit der simulierten Umgebung trainierte Roboter verschiedene Aufgaben, wie das Öffnen von Schubladen oder das Stellen von Tassen auf Regale, deutlich besser ausführen, als wenn er mit herkömmlichen Methoden trainiert worden wäre.

Die nächste Stufe

Derzeit benötigt "RialTo" drei Tage, um vollständig trainiert zu werden, sodass das Forschungsteam erwähnt, eine Verbesserung der zugrunde liegenden Algorithmen vorzunehmen und Basismodelle zu verwenden. Zusätzlich habe die Software aktuell noch Schwierigkeiten bei der Simulation von verformbaren Objekte oder Flüssigkeiten.

Die Forschenden arbeiten nun daran, die Resistenz von "RialTo" gegenüber verschiedenen Störungen zu erhalten und gleichzeitig die Anpassungsfähigkeit des Modells an neue Umgebungen zu verbessern. "Unser nächstes Ziel ist die Verwendung von vortrainierten Modellen, um den Lernprozess zu beschleunigen, den menschlichen Input zu minimieren und eine breitere Verallgemeinerungsfähigkeit zu erreichen", sagt Torne. "Unsere derzeitige Methode hat zwar ihre Grenzen - sie erfordert einige anfängliche Demonstrationen durch einen Menschen und eine beträchtliche Rechenzeit für das Training dieser Strategien (bis zu drei Tage) -, aber wir sehen sie als einen bedeutenden Schritt auf dem Weg. Dieser Ansatz bringt uns einer Zukunft näher, in der Roboter keine vordefinierten Richtlinien benötigen, die jedes Szenario abdecken."

 

Apropos Roboter: Boston Dynamics mustert seinen alten, hydraulischen Atlas-Roboter aus. Als Nachfolger hat der Hersteller im April 2024 den neuen und vollelektrischen Atlas angekündigt. Mehr dazu lesen Sie hier.

 

Webcode
QfyTW4jY