SWIRL: Selbstverbessernde Weltmodellierung ohne Aktionsdaten
Ein neues Forschungsprojekt namens SWIRL (Self‑Improving World Modelling with Latent Actions) zeigt, wie große Sprach‑ und Bildmodelle ihre Weltvorstellungen ohne kostenintensive, mit Aktionen beschriftete Daten verbessern können. Durch die Annahme, dass Aktionen als latente Variablen behandelt werden können, lernt SWIRL aus reinen Zustandssequenzen, die in der Praxis viel häufiger vorkommen.