MemFly: Echtzeit‑Memory‑Optimierung mit dem Information Bottleneck
Die neue Forschungsarbeit „MemFly“ präsentiert ein innovatives Framework, das die Langzeit‑Speicherung von Sprachmodellen in Echtzeit optimiert. Durch die Anwendung von Information‑Bottleneck‑Prinzipien kann MemFly redundante Daten effizient komprimieren, ohne die Genauigkeit der späteren Abrufe zu beeinträchtigen.
Ein zentrales Problem bestehender Systeme besteht darin, dass sie entweder zu stark komprimieren und wichtige Details verlieren oder die Speichergröße unnötig vergrößern. MemFly löst dieses Dilemma, indem es die Kompressions‑Entropie minimiert und gleichzeitig die Relevanz‑Entropie maximiert. Der Ansatz nutzt einen gradientenfreien Optimierer, um eine mehrschichtige Speicherstruktur aufzubauen, die sowohl platzsparend als auch leicht zugänglich ist.
Zur Ausnutzung der optimierten Speicherarchitektur entwickelt das Team einen hybriden Abrufmechanismus. Dieser kombiniert semantische, symbolische und topologische Pfade und integriert eine iterative Verfeinerung, um komplexe Mehr‑Sprung‑Abfragen zuverlässig zu beantworten. Dadurch wird die Flexibilität und Genauigkeit der Agenten deutlich erhöht.
Umfangreiche Experimente zeigen, dass MemFly die führenden Baselines in allen wichtigen Metriken übertrifft: die Kohärenz des Speichers, die Treue der Antworten und die Gesamt‑Genauigkeit steigen signifikant an. Die Ergebnisse deuten darauf hin, dass MemFly einen wichtigen Schritt in Richtung effizienter, kontextsensitiver KI‑Agenten darstellt.