KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “VQA-Benchmark”

ChromouVQA: Neues Benchmark für Vision‑Language‑Modelle mit chromatischer Tarnung

Vision‑Language‑Modelle (VLMs) haben die multimodale Verarbeitung von Bild- und Textdaten revolutioniert, stoßen jedoch bei der Erkennung v…

arXiv – cs.AI 08.12.2025 05:00

ToolScope: Agentisches Framework für multimodale Tool‑Nutzung in Visionaufgaben

In der jüngsten Veröffentlichung auf arXiv (2510.27363v1) wird ToolScope vorgestellt – ein neues, agentisches Framework, das große Sprachmo…

arXiv – cs.AI 03.11.2025 05:00