RAG-HAR: KI-gestützte Aktivitätserkennung ohne Training – Rekordleistung
Die neueste Veröffentlichung auf arXiv präsentiert RAG-HAR, ein völlig trainingsfreies Framework, das die Leistungsfähigkeit großer Sprachmodelle (LLMs) für die Erkennung menschlicher Aktivitäten nutzt.
RAG-HAR arbeitet mit leichtgewichtigen statistischen Deskriptoren, die aus Sensordaten berechnet werden. Anschließend werden semantisch ähnliche Beispiele aus einer Vektor‑Datenbank abgerufen und als kontextuelle Evidenz in die LLM‑gestützte Klassifikation einfließen.
Durch gezielte Prompt‑Optimierung und einen LLM‑basierten Aktivitätsdeskriptor, der kontextreiche Vektor‑Datenbanken erzeugt, erreicht RAG-HAR bislang die besten Ergebnisse auf sechs unterschiedlichen HAR‑Benchmarks – und das ohne jegliches Training oder Feintuning.
Besonders hervorzuheben ist die Fähigkeit von RAG-HAR, bislang unbekannte Aktivitäten zu erkennen und sinnvoll zu beschriften, was die praktische Anwendbarkeit in Bereichen wie Gesundheitswesen, Rehabilitation und Smart‑Home‑Technologien deutlich erhöht.