KnowDR-REC: Neuer Benchmark prüft multimodale Sprachmodelle mit realen Wissensdaten
Die Aufgabe der Referring Expression Comprehension (REC) verlangt, dass ein Modell ein Zielobjekt in einem Bild anhand einer Textbeschreibung exakt erkennt. Bisher beruhen die gängigen REC-Benchmarks entweder ausschließ…