Forschung
RAPO: Erkundung von LLM-Agenten durch Retrieval‑gestützte Optimierung
Agentic Reinforcement Learning (Agentic RL) hat das Potenzial, große Sprachmodelle (LLM) zu leistungsstarken Agenten zu machen, die komplex…
arXiv – cs.AI