DeepMind & UIUC präsentieren Evo-Memory – Benchmark für LLM-Erfahrungsnutzung
Große Sprachmodelle beginnen, alles zu speichern, was sie sehen. Doch kann ein Agent aus diesen Aufzeichnungen wirklich lernen und seine Strategien im Test verbessern, anstatt lediglich Kontextfenster zu wiederholen? Fo…