KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “AstroReason-Bench”

AstroReason-Bench: Testet Agentenplanung in komplexen Raumfahrtproblemen

Neues Benchmarking-Tool namens AstroReason-Bench wurde vorgestellt, um die Leistungsfähigkeit von agentenbasierten Sprachmodellen (LLMs) in…

arXiv – cs.AI 19.01.2026 05:00