VRSLU: Benchmark mit visuellen Szenen und Begründungen für Sprachverstehen
Spoken Language Understanding (SLU) umfasst die Aufgaben Intent Detection und Slot Filling. Für den Einsatz in der Praxis ist es entscheidend, dass SLU-Systeme nicht nur die Intention eines Nutzers erkennen, sondern auch den Kontext, die Nutzerprofile und Wissensgraphen berücksichtigen. Aktuelle Datensätze hinken dabei hinterher, weil sie Kontextinformationen zu stark idealisieren und die Möglichkeit, die Entscheidungsprozesse zu erklären, vernachlässigen.