Agent lernt latente Strategien, um sich dynamisch an neue Partner anzupassen
In einer neuen Studie aus dem arXiv wird gezeigt, wie ein künstlicher Agent in Echtzeit auf die individuellen Präferenzen und sich wandelnden Verhaltensmuster seiner menschlichen oder künstlichen Teamkollegen reagieren kann. Durch die Kombination eines variationalen Autoencoders, Clustering-Methoden und eines Regret-Minimization-Algorithmus kann der Agent eine latente Repräsentation möglicher Partnerstrategien lernen, diese in erkennbare Typen einteilen und sich anschließend gezielt an jede Kategorie anpassen.