AEMA: Verifizierbares Evaluationsframework für vertrauenswürdige LLM-Agenten
Die Bewertung von großen Sprachmodellen (LLM), die in Multi-Agenten-Systemen eingesetzt werden, stellt nach wie vor ein zentrales Problem dar. Solche Systeme müssen zuverlässig zusammenarbeiten, Entscheidungen nachvollz…