HiMem: Hierarchisches Langzeitgedächtnis für LLM-Agenten in langen Zeithorizonten

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In einer neuen Veröffentlichung auf arXiv präsentiert HiMem ein innovatives, hierarchisches Langzeitgedächtnis, das speziell für große Sprachmodelle (LLM) entwickelt wurde, die über lange Zeiträume hinweg interagieren. Das System kombiniert zwei zentrale Gedächtnistypen – Episode Memory und Note Memory – und verbindet sie zu einer strukturierten, semantisch vernetzten Hierarchie.

Episode Memory wird mithilfe einer „Topic‑Aware Event–Surprise Dual‑Channel Segmentation“ aufgebaut. Diese Technik trennt Gesprächsereignisse in thematisch relevante Segmente und erkennt gleichzeitig Überraschungsfaktoren, um wichtige Ereignisse gezielt zu speichern. Note Memory hingegen extrahiert stabile Wissensfragmente aus den gesammelten Daten durch einen mehrstufigen Informations‑Extraktionsprozess.

Durch die semantische Verknüpfung beider Gedächtnistypen entsteht eine Brücke zwischen konkreten Interaktionsereignissen und abstraktem Wissen. HiMem unterstützt sowohl hybride als auch „best‑effort“ Abrufstrategien, um Genauigkeit und Effizienz auszubalancieren. Zusätzlich integriert das System eine konfliktbewusste Memory‑Reconsolidation, die gespeichertes Wissen anhand von Abruf‑Feedback kontinuierlich überarbeitet und erweitert.

Die Autoren zeigen in umfangreichen Experimenten, dass HiMem bei Langzeit‑Dialog‑Benchmarks die Leistung von etablierten Baselines in Bezug auf Genauigkeit, Konsistenz und langfristiges Denken deutlich übertrifft – und das bei gleichzeitig guter Effizienz. Damit bietet HiMem ein skalierbares, adaptives Designparadigma für LLM‑basierte Gesprächsagenten, die sich im Laufe der Zeit selbst weiterentwickeln können.

Der zugehörige Code ist öffentlich verfügbar, sodass Entwickler die Technologie leicht in ihre eigenen Projekte integrieren können.

Ähnliche Artikel