ResAgent: Entropie- und bildbasierte Methode für Referenzsegmentierung
Die Referenzsegmentierung (RES) verbindet Bild- und Sprachverarbeitung, um Objekte anhand freier sprachlicher Beschreibungen exakt zu markieren. Sie ist entscheidend für Anwendungen wie Mensch‑Roboter‑Interaktion und Au…