Forschung
**Neue Bewertungsmethode deckt versteckte Fehler bei KI-Agenten auf**
In hochriskanten Einsatzbereichen werden KI‑Agenten, die auf großen Sprachmodellen (LLMs) basieren, immer häufiger eingesetzt. Bisher messe…
arXiv – cs.AI