Forschung
AEMA: Verifizierbares Evaluationsframework für vertrauenswürdige LLM-Agenten
Die Bewertung von großen Sprachmodellen (LLM), die in Multi-Agenten-Systemen eingesetzt werden, stellt nach wie vor ein zentrales Problem d…
arXiv – cs.AI