M3-Bench: Neuer Maßstab für multimodale Tool‑Nutzung in komplexen Workflows
Die Wissenschaft erhält mit M3‑Bench einen ersten, umfassenden Test für multimodale Tool‑Nutzung unter dem Model Context Protocol. Der Benchmark richtet sich an realistische, mehrstufige und mehrthreadige Arbeitsabläufe…