SPARC: Einphasen‑Anpassung für OOD‑Generalisierung in Robotik und Rennsimulation

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Die Fähigkeit, in völlig neuen Umgebungen zuverlässig zu agieren, gilt als einer der größten Herausforderungen in Robotik und autonomer Steuerung. In der Kontext‑Reinforcement‑Learning‑Forschung müssen Agenten in Szenarien mit wechselnden Bedingungen – etwa selbstfahrende Autos, die auf unbekanntem Terrain oder bei wechselndem Wetter operieren – ohne explizite Kontextinformationen am Testzeitpunkt funktionieren.

Das neue Verfahren SPARC (Single‑Phase Adaptation for Robust Control) vereinfacht die bisher üblichen, zweistufigen Ansätze, bei denen ein Kontext‑Encoder und ein Historien‑Anpassungsmodul separat trainiert werden. SPARC kombiniert diese Schritte zu einer einzigen, effizienten Phase, wodurch Implementierung und Training deutlich beschleunigt werden.

In umfangreichen Tests auf dem hochrealistischen Rennsimulator Gran Turismo 7 sowie in wind‑gestörten MuJoCo‑Umgebungen zeigte SPARC eine zuverlässige und robuste Generalisierung auf unbekannte Szenarien. Damit liefert die Methode einen vielversprechenden Weg, um Agenten in der Praxis für unerwartete Umgebungen auszurüsten.

Ähnliche Artikel