Forschung
Neue Benchmarks zeigen: Multimodale LLMs liefern inkonsistente Antworten
Forscher haben zwei neue Benchmarks – REST und REST+ (Render‑Equivalence Stress Tests) – entwickelt, um die Konsistenz multimodaler Large L…
arXiv – cs.AI