Agent lernt latente Strategien, um sich dynamisch an neue Partner anzupassen

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In einer neuen Studie aus dem arXiv wird gezeigt, wie ein künstlicher Agent in Echtzeit auf die individuellen Präferenzen und sich wandelnden Verhaltensmuster seiner menschlichen oder künstlichen Teamkollegen reagieren kann. Durch die Kombination eines variationalen Autoencoders, Clustering-Methoden und eines Regret-Minimization-Algorithmus kann der Agent eine latente Repräsentation möglicher Partnerstrategien lernen, diese in erkennbare Typen einteilen und sich anschließend gezielt an jede Kategorie anpassen.

Der Ansatz wird in einer modifizierten Version des Overcooked-Spiels getestet, einem komplexen Kooperationsspiel, das schnelle Entscheidungen und präzise Abstimmung erfordert. Die Experimente zeigen, dass der Agent im Vergleich zu bestehenden Baselines sowohl mit unbekannten Menschen als auch mit anderen Agenten die höchste Leistung erzielt.

Die Arbeit demonstriert damit, dass adaptive Kooperationsstrategien, die auf latenten Repräsentationen basieren, eine effektive Lösung für heterogene Teams darstellen, insbesondere in zeitkritischen und strategisch anspruchsvollen Umgebungen.

Ähnliche Artikel