Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Testframework”
Forschung

<h1>Neues Benchmark ORBIT testet Objekt‑Eigenschafts‑Logik in VLMs</h1> <p>Vision‑Language‑Modelle (VLMs) haben bei vielen visuellen Frage‑Antwort‑Benchmarks große Fortschritte erzielt, doch bleibt unklar, ob sie tatsächlich über die dargestellten Objekte abstrahieren und logisch nachdenken können. Um diese Lücke zu schließen, präsentiert die Forschung das Benchmark ORBIT – ein systematisches Testframework, das speziell auf die Erkennung und Bewertung von Objekt‑Eigenschaften abzielt.</p> <p>ORBIT umfasst 3

arXiv – cs.AI