Forschung
WorkflowPerturb: Kalibrierte Stresstests für Multi-Agent-Workflows
Mit dem Aufkommen von Sprachmodellen, die komplexe Aufgaben in strukturierte Arbeitsabläufe zerlegen, wird die automatische Bewertung diese…
arXiv – cs.AI