Aktive Epistemische Kontrolle: Schnellere Planung in interaktiven Umgebungen
In interaktiven Umgebungen, in denen wichtige Vorbedingungen wie Objektpositionen oder Behälterzustände zu Beginn unbekannt sind, stellt die Planung eine große Herausforderung dar. Das neue Verfahren „Active Epistemic Control“ (AEC) kombiniert ein lernbasiertes Weltmodell mit einer klaren Trennung zwischen einem „grounded fact store“ für verbindliche Entscheidungen und einem „belief store“ zur Vorauswahl möglicher Pläne.
Bei jedem Schritt entscheidet AEC, ob ein neues Merkmal aus der Umgebung abgefragt werden soll – wenn Unsicherheit hoch oder Vorhersagen unklar sind – oder ob das Modell die Hypothesen simuliert, um die Planoptionen zu filtern. Nur wenn alle relevanten Vorbedingungen durch echte Beobachtungen bestätigt sind, wird ein Plan endgültig festgelegt. Dadurch bleiben simulierte Glaubenswerte effizient, können aber die Planbarkeit nicht direkt beeinflussen.
Tests in den simulierten Welten ALFWorld und ScienceWorld zeigen, dass AEC vergleichbare Erfolgsraten wie starke LLM-basierte Agenten erreicht, jedoch mit deutlich weniger Replanungsrunden. Das Ergebnis ist eine schnellere und zuverlässigere Entscheidungsfindung in komplexen, teilweise beobachtbaren Szenarien.