Regulierte latente Dynamikvorhersage: starke Basis für Verhaltenstiefenmodelle
Behavioral Foundation Models (BFMs) versprechen Agenten, die sich an beliebige unbekannte Belohnungen oder Aufgaben anpassen können. In der Praxis erreichen sie jedoch nur nahezu optimale Strategien, wenn die Belohnungs…