BizFinBench.v2: Neuer zweistufiger, zweisprachiger Benchmark für Finanz-LLMs
Die rasante Weiterentwicklung großer Sprachmodelle hat sie zu einem Schlüsselwerkzeug für die Finanzwelt gemacht. Doch bisherige Benchmarks starren oft an simulierte Daten oder statische Szenarien, wodurch sie die Anforderungen an Authentizität und Echtzeit‑Reaktionsfähigkeit in echten Finanzdienstleistungen nicht erfüllen.