DR. WELL: Dezentraler neuro-symbolischer Planungsrahmen für Multi-Agenten
Das neue System DR. WELL eröffnet einen innovativen Ansatz für die Koordination mehrerer Agenten, die unter eingeschränkter Kommunikation und unvollständiger Information zusammenarbeiten müssen. Durch die Kombination neuronaler Lernmechanismen mit symbolischer Planung schafft es DR. WELL, komplexe Aufgaben auf einer höheren Abstraktionsebene zu lösen und gleichzeitig die Flexibilität und Anpassungsfähigkeit der Agenten zu erhöhen.
Der Kern des Frameworks ist ein zweiphasiger Verhandlungsprozess. Zunächst schlagen die Agenten mögliche Rollen vor, die sie übernehmen können, und nutzen dabei ihr internes Wissen, um die beste Option zu ermitteln. Anschließend wird eine gemeinsame Rollenverteilung unter Berücksichtigung von Konsens und Umgebungsbeschränkungen festgelegt. Nach der Verpflichtung generieren die Agenten eigenständig symbolische Aktionspläne für ihre jeweiligen Rollen, ohne dabei detaillierte Trajektorien preiszugeben. Diese Pläne werden anhand eines gemeinsamen Weltmodells, das kontinuierlich mit den aktuellen Zuständen aktualisiert wird, ausgeführt und verfeinert.
Durch die Fokussierung auf symbolische Pläne statt auf rohe Trajektorien vermeidet DR. WELL die anfällige Schritt-für-Schritt-Alignment-Problematik. Stattdessen ermöglicht es die Methode, wiederverwendbare, synchronisierbare und leicht interpretierbare Operationen zu entwickeln. Das dynamische Weltmodell lernt dabei wiederkehrende Muster und optimiert die Planung kontinuierlich, was die Effizienz und Zuverlässigkeit der Agenten erhöht.
Experimentelle Tests an kooperativen Block‑Push‑Aufgaben zeigen, dass die Agenten sich über mehrere Episoden hinweg anpassen und die Erfolgsrate sowie die Ausführungszeit signifikant steigen. Das dynamische Weltmodell trägt dazu bei, die Aufgaben schneller zu erledigen, indem es durch Verhandlung und Selbstverbesserung die Planung optimiert, obwohl dabei ein moderater Zeitaufwand für die Modellaktualisierung entsteht.