Forschung
CATArena: Neues Benchmark-Tool für lernende LLM-Agenten
Large Language Model (LLM)-Agenten haben sich von einfachen Textgeneratoren zu autonomen Systemen entwickelt, die komplexe Aufgaben durch I…
arXiv – cs.AI