Agenten mit eigenständiger Gedächtnisverwaltung: LLMs lernen, was langfristig und kurzzeitig gespeichert wird
Forscher haben einen neuen Ansatz vorgestellt, bei dem ein einzelner Lernalgorithmus entscheidet, welche Informationen ein Large‑Language‑Model (LLM) langfristig speichert, welche im Kurzzeit‑Kontext bleiben und welche verworfen werden – und das ohne manuell eingestellte Heuristiken oder zusätzliche Kontrollschichten.
Der Schlüssel liegt darin, dass die Gedächtnisverwaltung im selben Aktionsraum wie die Textgenerierung stattfindet. Dadurch kann ein Agent gleichzeitig Texte erzeugen und sein eigenes Gedächtnis anpassen, wobei die Entscheidungen auf den gleichen Lernmechanismen beruhen, die für die Sprachproduktion verwendet werden.
Diese Entwicklung vereint bisher getrennte Konzepte von Langzeit‑ und Kurzzeitgedächtnis in einer einzigen, lernfähigen Policy. Damit eröffnen sich neue Möglichkeiten für autonome LLM‑Agenten, die ihre Erinnerungen selbstständig organisieren und dadurch effizienter und kontextsensitiver agieren können.