FinTrace: Benchmark für LLM-Tool-Calls in Finanz – 800 Trajektorien, 34 Kategorien
FinTrace, ein neues Benchmark, richtet sich an die Bewertung von Large Language Models (LLMs) beim Tool‑Calling in komplexen Finanzaufgaben. Das Set umfasst 800 von Experten annotierte Trajektorien, die 34 reale Finanza…