Forschung
Reinforcement Learning verbessert Planung von LLM-Agenten ohne verifizierbare Daten
Die Leistungsfähigkeit von Large‑Language‑Model‑Agenten hängt vor allem von zwei Kernfähigkeiten ab: der Planung von Aktionen und der Zusam…
arXiv – cs.LG