DeepMind & UIUC präsentieren Evo-Memory – Benchmark für LLM-Erfahrungsnutzung
Große Sprachmodelle beginnen, alles zu speichern, was sie sehen. Doch kann ein Agent aus diesen Aufzeichnungen wirklich lernen und seine Strategien im Test verbessern, anstatt lediglich Kontextfenster zu wiederholen? Forscher der University of Illinois Urbana‑Champaign und von Google DeepMind haben die Antwort mit dem neuen Evo‑Memory-Benchmark entwickelt.