Roboter lernen schneller: Konzeptbasierte Imitation mit ConceptACT

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Im Bereich der Robotik ermöglicht Imitation Learning, dass Maschinen komplexe Manipulationsaufgaben aus menschlichen Demonstrationen erlernen. Traditionelle Ansätze stützen sich dabei ausschließlich auf rohe sensorimotorische Daten und vernachlässigen dabei das reichhaltige semantische Wissen, das Menschen intuitiv besitzen.

Die neue Methode ConceptACT erweitert das bereits etablierte Action Chunking mit Transformers um episode‑level semantische Konzeptannotationen. Während des Trainings werden Konzepte wie Objektmerkmale, räumliche Beziehungen und Aufgabenbeschränkungen von Menschen bereitgestellt, ohne dass diese Informationen bei der Ausführung des Roboters benötigt werden. Dadurch entsteht ein minimaler Aufwand bei der Annotation, während die Lernleistung erheblich gesteigert wird.

ConceptACT integriert die Konzepte in einer angepassten Transformer‑Architektur, bei der die letzte Encoder‑Schicht eine konzeptbewusste Cross‑Attention nutzt. Diese wird gezielt darauf trainiert, die menschlichen Annotationen zu spiegeln. In Experimenten mit zwei Manipulationsaufgaben, die logische Einschränkungen enthalten, konvergiert ConceptACT schneller und erreicht eine deutlich höhere Sample‑Effizienz als das Standard‑ACT-Modell.

Besonders hervorzuheben ist, dass die architektonische Einbindung über Attention‑Mechanismen die Leistung deutlich übertrifft, wenn man sie mit einfachen Hilfsverlusten oder sprachbasierten Modellen vergleicht. Die Ergebnisse zeigen, dass eine sorgfältig integrierte semantische Supervision starke induktive Vorurteile liefert und damit das Lernen von Robotern wesentlich effizienter gestaltet.

Ähnliche Artikel