Mehragenten nutzen prädiktives Codieren für gemeinsames räumliches Gedächtnis

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Ein neues Multi-Agenten-Framework setzt auf prädiktives Codieren, um ein konsistentes räumliches Gedächtnis zu teilen und zu rekonstruieren. Dabei wird die Koordination als Minimierung der gegenseitigen Unsicherheit formuliert und als Information‑Bottleneck‑Ziel umgesetzt. Das System lehrt die Agenten nicht nur, wer und was kommunizieren soll, sondern auch, wann.

Im Kern steht ein grid‑cell‑ähnliches metrisches System, das als interne räumliche Codierung für die Selbstlokalisierung dient und sich spontan aus selbstüberwachtem Bewegungs­vorhersagen entwickelt. Auf dieser Grundlage bauen die Agenten schrittweise eine bandbreiten‑effiziente Kommunikations­mechanik auf und entwickeln spezialisierte neuronale Populationen, die die Positionen ihrer Partner wie hippocampale soziale Ortszellen (SPCs) codieren. Eine hierarchische Reinforcement‑Learning‑Policy erkundet aktiv, um die gemeinsame Unsicherheit zu reduzieren.

Im Memory‑Maze‑Benchmark zeigt der Ansatz eine bemerkenswerte Widerstandsfähigkeit gegenüber Bandbreiten­beschränkungen: Der Erfolg sinkt von 73,5 % auf 64,4 % bei einer Reduktion von 128 auf 4 Bits pro Schritt, während ein vollständiges Broadcast‑Baseline von 67,6 % auf 28,6 % zusammenbricht. Die Ergebnisse legen eine theoretisch fundierte und biologisch plausible Grundlage dafür nahe, wie komplexe soziale Repräsentationen aus einem einheitlichen prädiktiven Antrieb entstehen und zu kollektiver sozialer Intelligenz führen können.

Ähnliche Artikel