Behavior Cloning skaliert: Open Model verbessert kausales Denken Echtzeit-Gameplay

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In einer neuen Veröffentlichung auf arXiv (2601.04575v1) wird gezeigt, dass Behavior Cloning – das Kopieren menschlicher Aktionen – dank größerer Modelle und Datenmengen ein starkes Fundament für viele Aufgaben bildet. Die Autoren stellen ein Open‑Recipe vor, mit dem ein Basis‑Modell für Echtzeit‑Videospiele auf einem Konsumenten‑GPU trainiert und betrieben werden kann.

Das Projekt liefert mehr als 8.300 Stunden hochwertiger menschlicher Gameplay‑Daten, den kompletten Trainings‑ und Inferenzcode sowie vortrainierte Checkpoints unter einer offenen Lizenz. Das beste Modell kann eine Vielzahl von 3‑D‑Spielen auf einem Niveau spielen, das mit menschlicher Leistung konkurriert.

Ein Schwerpunkt der Arbeit liegt auf der Untersuchung der Skalierungseffekte von Behavior Cloning. In einem einfachen Toy‑Problem wird demonstriert, dass sowohl mehr Trainingsdaten als auch tiefere Netzwerke zu einer kausaleren Entscheidungsfindung führen. Diese Erkenntnisse werden anschließend auf Modelle bis zu 1,2 Milliarden Parametern übertragen, wobei ähnliche Skalierungsmuster beobachtet werden.

Die Ergebnisse legen nahe, dass die Kombination aus umfangreichen Daten und großen Modellen nicht nur die Spielleistung steigert, sondern auch das kausale Verständnis des Modells verbessert – ein wichtiger Schritt für die Entwicklung intelligenter, erklärbarer KI‑Agenten.

Ähnliche Artikel