Forschung
ToolPRMBench: Benchmark für Prozessbelohnungsmodelle bei Tool‑Agenten
In der Welt der KI‑Agenten, die komplexe Werkzeuge nutzen, haben belohnungsbasierte Suchmethoden gezeigt, dass sie die Leistung deutlich st…
arXiv – cs.AI