Forschung
TSR: Trajektorien‑Suche verbessert Multi‑Turn RL für LLM‑Agenten
Die neuesten Fortschritte bei großen Sprachmodellen (LLMs) führen zu einem Paradigmenwechsel: Statt statischer Trainingsdaten werden Agente…
arXiv – cs.AI