<h1>LLM-Agenten lernen durch Interaktion: Umgebungen skalieren für komplexe Aufgaben</h1> <p>Moderne LLM-basierte Agenten sind in der Lage, eigenständig anspruchsvolle Aufgaben in unterschiedlichen Bereichen zu bewältigen. Doch um adaptive Verhaltensweisen und langfristige Entscheidungsfindung zu fördern, reicht das Training auf statischen Datensätzen, die aus menschlichem Wissen abgeleitet sind, nicht mehr aus. Solche Datensätze sind teuer zu erstellen und bieten weder Dynamik noch Realitätsnähe.</p> <p>Di

arXiv – cs.LG Original
Anzeige