Neues Tool bewertet Maskenqualität bei sprachgesteuerter Audio-Visual-Segmentierung
In einer wegweisenden Veröffentlichung stellt ein Forschungsteam ein neues Verfahren vor, das die Qualität von Segmentierungsmasken in sprachgesteuerten Audio‑Visual‑Segmentierungsaufgaben (Ref‑AVS) ohne Referenz‑Annotationen beurteilen kann. Das Konzept, genannt Mask Quality Assessment in the Ref‑AVS context (MQA‑RefAVS), fordert die Schätzung des Intersection‑over‑Union (IoU) einer vorgeschlagenen Maske, die Identifikation des Fehlertyps und die Empfehlung einer konkreten Qualitätskontrollmaßnahme.