Roboter erhalten neues Gedächtnis: 15‑Minuten‑Kontext für komplexe Aufgaben

Moderne Roboter, die auf Vision‑Language‑Action‑Modellen (VLA) basieren, greifen in der Regel nur auf die aktuelle Beobachtung oder eine sehr kurze Vorgeschichte zurück. Dieses Fehlen eines längeren Gedächtnisses führt dazu, dass Aufgaben mit langen Zeithorizonten – etwa das Reinigen einer Küche oder das Befolgen eines komplexen Rezepts – schwer zu bewältigen sind.

Um dieses Problem zu lösen, haben Forscher aus dem Physical Intelligence‑Projekt in Kooperation mit Stanford, UC Berkeley und MIT ein neues System namens MEM (Multi‑Scale Memory) entwickelt. MEM nutzt eine mehrstufige Speicherarchitektur, die es VLA‑Modellen mit 3 bis 4 Milliarden Parametern, wie dem Gemma‑Modell, ermöglicht, bis zu 15 Minuten an Kontext zu behalten.

Durch die Erweiterung des Gedächtnisses können Roboter nun langfristige Aufgaben zuverlässig ausführen und ihre Leistung in realen Umgebungen deutlich steigern. Das MEM-System markiert damit einen bedeutenden Fortschritt in der Entwicklung von Robotern, die komplexe, zeitintensive Aufgaben bewältigen können.

🍪 Cookie-Einstellungen