ATP-Bench: Messlatte für agentenbasierte Toolplanung in multimodalen Modellen
Die neueste Studie aus dem Bereich multimodaler Large Language Models (MLLMs) präsentiert ATP‑Bench, einen wegweisenden Benchmark, der die Fähigkeit von Modellen zur interleaved text‑und‑image‑Generierung auf die Probe…