KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Vision-and-Language Navigation”

Benutzerfeedback verbessert kontinuierliche Anpassung in Vision-and-Language Navigation

The text you provided is already in German.

arXiv – cs.AI 12.12.2025 05:00

<p>UNeMo: Multimodales Weltmodell verbessert visuell-sprachliche Navigation</p> <p>Die Vision-and-Language Navigation (VLN) stellt Agenten vor die Aufgabe, komplexe Umgebungen allein durch visuelle Bilder und natürliche Sprachbefehle zu erkunden. Aktuelle Fortschritte mit großen Sprachmodellen (LLMs) haben die sprachbasierte Navigation verbessert, doch die Fähigkeit, visuelle Informationen zu verarbeiten, bleibt begrenzt. Zudem werden die Reasoning‑Module häufig getrennt von den Navigationsstrategien traini

arXiv – cs.AI 25.11.2025 05:00

R3: Dual-Prozess-System verbessert Vision-and-Language Navigation um 3,3 %

In der Vision-and-Language Navigation (VLN) muss ein Agent komplexe 3‑D‑Umgebungen dynamisch erkunden und dabei menschliche Anweisungen bef…

arXiv – cs.AI 19.11.2025 05:00