Neuer Benchmark Mem2ActBench prüft Langzeitgedächtnis bei KI-Agenten
Ein neues Benchmarking-Tool namens Mem2ActBench wurde vorgestellt, um die Fähigkeit von KI-Agenten zu messen, ihr Langzeitgedächtnis aktiv zu nutzen, wenn sie komplexe, toolbasierte Aufgaben ausführen. Im Gegensatz zu b…