KI News: Kurz und klar.

Anmelden

MM-OPERA: Benchmarking Open-ended Association Reasoning for Large Vision-Language Models

arXiv – cs.LG • 03.11.2025 05:00 • Original

#Large Vision-Language Models #Association Intelligence #MM-OPERA #Remote-Item Association #In-Context Association #Psychometric Evaluation #LLM-as-a-Judge

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 03.02.2026 05:00

LLM als Richter: Neue Methode prüft Zuverlässigkeit mit Item Response Theory

arXiv – cs.AI • 15.01.2026 05:00

PRA: KI-Agent simuliert individuelle Datenschutzbedenken wie ein Mensch

arXiv – cs.AI • 14.01.2026 05:00

Project Synapse: Hierarchisches Multi-Agenten-Framework löst Lieferengpässe autonom

arXiv – cs.LG • 22.12.2025 05:00

AdvJudge‑Zero: Kontroll‑Token kippen LLM‑Judges

Towards Data Science • 24.11.2025 19:33

LLM als Richter: Wie KI-Modelle bewertet werden

arXiv – cs.LG • 24.11.2025 05:00

Personalisierter Router: Graphbasierte LLM-Auswahl nach Nutzerpräferenzen