RLSLM: Hybrid‑Lernmodell vereint Regeln und KI für sozialverträgliche Navigation
Ein neues Forschungsprojekt namens RLSLM präsentiert ein hybrides Reinforcement‑Learning‑Framework, das die Klarheit von regelbasierten Ansätzen mit der Flexibilität datengetriebener Methoden kombiniert. Ziel ist es, Agenten zu entwickeln, die sich in von Menschen frequentierten Räumen ohne Unbehagen bewegen können.
Im Kern steht ein Social‑Locomotion‑Model, das auf experimentellen Verhaltensdaten basiert. Es erzeugt ein richtungsabhängiges Komfortfeld, das den menschlichen Wohlfühlbereich im Raum quantifiziert. Dieses Feld wird direkt in die Belohnungsfunktion des Reinforcement‑Learning‑Systems integriert, sodass die Agenten lernen, sowohl mechanische Energie zu sparen als auch soziale Distanz zu wahren.
Durch die gleichzeitige Optimierung von Energieeffizienz und sozialem Komfort gelingt es RLSLM, persönliche und Gruppenspazierräume zu respektieren und gleichzeitig die Notwendigkeit umfangreicher Trainingsdaten zu reduzieren. In einer VR‑basierten Interaktionstest‑Sitzung zeigte das System eine deutlich bessere Nutzererfahrung als aktuelle regelbasierte Modelle.
Zusätzliche Ablations- und Sensitivitätsanalysen belegen, dass RLSLM nicht nur leistungsfähiger, sondern auch interpretierbarer ist als reine datengetriebene Ansätze. Das Ergebnis ist eine skalierbare, menschenzentrierte Methode, die Erkenntnisse aus der Kognitionswissenschaft nahtlos mit moderner Machine‑Learning‑Technologie verbindet.