Aktive Epistemische Kontrolle: Schnellere Planung in interaktiven Umgebungen In interaktiven Umgebungen, in denen wichtige Vorbedingungen wie Objektpositionen oder Behälterzustände zu Beginn unbekannt sind, stellt die Planung eine große Herausforderung dar. Das neue Verfahren „Active Epistemic Control“ (AEC) kombiniert ein lernbasiertes Weltmodell mit einer klaren Trennung zwischen einem „grounded fact store“ für verbindliche Entscheidungen und einem „belief store“ zur Vorauswahl möglicher Pläne. arXiv – cs.AI 05.02.2026 05:00
Nightmare Dreamer: Sicheres RL ohne Verletzungen Reinforcement Learning hat in der Robotik enorme Fortschritte erzielt, doch die fehlenden Sicherheitsgarantien hemmen seine breite Anwendung. Mit dem neuen Modell‑basierten Ansatz Nightmare Dreamer aus dem arXiv‑Papersatz 2601.04686v1 wird dieses Problem angegangen. Der Algorithmus nutzt ein gelerntes Weltmodell, um potenzielle Sicherheitsverletzungen vorherzusagen und plant daraufhin Handlungen, die diese Risiken minimieren. arXiv – cs.LG 09.01.2026 05:00
WMAct: LLM-Agenten lernen durch Handeln, reduzieren Interaktionen für Weltmodell Ein neuer Beitrag auf arXiv (2511.23476v1) präsentiert WMAct, eine Methode, die große Sprachmodelle (LLMs) befähigt, ihre Weltmodelle durch aktives Handeln zu internalisieren. Anstatt starre, vorgegebene Denkprozesse zu verfolgen, lassen die Autoren die Modelle ihre eigenen Erfahrungen sammeln und daraus lernen. arXiv – cs.AI 01.12.2025 05:00
Neue Studie enthüllt Schwächen von Vision‑Language‑Modellen bei räumlichem Denken Eine kürzlich veröffentlichte Arbeit auf arXiv (2511.13782v1) untersucht die räumlichen Denkfähigkeiten moderner Vision‑Language‑Modelle (VLMs) wie DeepSeek R1, OpenAI o3 und Gemini 2.5 Pro. Die Autoren stellen fest, dass trotz beeindruckender Leistungen in logischem Schließen und Problemlösen die Modelle bei Aufgaben, die mentale Rotation, Navigation oder die Erfassung räumlicher Beziehungen erfordern, deutlich hinter den Erwartungen zurückbleiben. arXiv – cs.AI 19.11.2025 05:00
MBZUAI präsentiert PAN – das neue Weltmodell für interaktive Langzeit‑Simulation Die meisten Text‑zu‑Video‑Modelle erzeugen lediglich ein einzelnes Video aus einem Prompt und hören danach auf. Sie behalten keinen internen Weltzustand, der sich weiterentwickelt, wenn neue Aktionen eintreffen. MarkTechPost 15.11.2025 17:13
SEBA: Effiziente Black‑Box‑Angriffe auf visuelles Reinforcement Learning In der Welt des visuellen Reinforcement Learning (RL) wurden enorme Fortschritte bei der Steuerung von Robotern und der Bildverarbeitung erzielt. Gleichzeitig bleibt die Anfälligkeit dieser Systeme gegenüber feindlichen Störungen weitgehend unerforscht. Traditionelle Black‑Box‑Angriffe konzentrieren sich meist auf vektorbasierte oder diskrete Aktionsräume und stoßen bei bildbasierten, kontinuierlichen Steuerungen an ihre Grenzen, weil die Aktionsmenge riesig ist und viele Umgebungsabfragen erforderlich werden. arXiv – cs.LG 14.11.2025 05:00
Neue Muster für Weltmodelle: Agenten bauen adaptive Web-Modelle Ein neues arXiv-Papier präsentiert zwei innovative Architekturmuster, die die Autonomie von Softwareagenten auf ein neues Level heben. Durch die gezielte Umwandlung von strukturierten Daten – etwa dem DOM von Webseiten oder semantischen Servicebeschreibungen – können Agenten ein präzises, handlungsfähiges Weltmodell erstellen. arXiv – cs.AI 29.10.2025 04:00
Sprachliche Anleitung beschleunigt Lernen: Neues Modell für soziales Lernen Ein neues Forschungsmodell aus dem Bereich der künstlichen Intelligenz zeigt, wie sprachliche Hinweise und persönliche Erfahrung gemeinsam das Lernen in komplexen Aufgaben beschleunigen können. Durch die Kombination von Sprachdaten und sensorischer Wahrnehmung entsteht ein probabilistisches Weltmodell, das sowohl menschliche Ratschläge interpretiert als auch selbst generiert. arXiv – cs.AI 03.09.2025 05:00
Zielgerichtete Zustände: Wie Ziele Weltmodelle formen Eine neue Studie auf arXiv präsentiert ein innovatives Konzept, das die Art und Weise, wie intelligente Agenten ihr Verhalten steuern, neu definiert. Anstatt die Weltmodelle in getrennte Beschreibungs- und Bewertungsbestandteile zu zerlegen, schlägt die Arbeit vor, dass beide Aspekte gleichzeitig aus den Zielsetzungen des Agenten entstehen. arXiv – cs.AI 22.08.2025 05:00