Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Dateisystem”
Forschung

<h1>LLMs als autonome Agenten: Warum Größe nicht genügt – Analyse von Erfolgen und Fehlern</h1> <p>Eine neue Untersuchung von arXiv beleuchtet, wie große Sprachmodelle (LLMs) als selbstständige Agenten mit Werkzeugnutzung versagen. Die Autoren analysieren 900 Ausführungsprotokolle von Granite 4 Small, Llama 4 Maverick und DeepSeek V3.1 in vier unterschiedlichen Szenarien – Dateisystem, Text‑Extraktion, CSV‑Analyse und SQL‑Abfragen.</p> <p>Statt nur aggregierte Punktzahlen zu betrachten, führen die Forscher

arXiv – cs.AI