Forschung
Neues Benchmark AMA-Bench prüft Langzeitgedächtnis von KI-Agenten
Die Forschung im Bereich der großen Sprachmodelle (LLMs) hat einen wichtigen Meilenstein gesetzt: Mit dem neuen Benchmark AMA-Bench (Agent…
arXiv – cs.AI