Forschung
FinTrace: Benchmark für LLM-Tool-Calls in Finanz – 800 Trajektorien, 34 Kategorien
FinTrace, ein neues Benchmark, richtet sich an die Bewertung von Large Language Models (LLMs) beim Tool‑Calling in komplexen Finanzaufgaben…
arXiv – cs.AI