Forschung
JADE: Dynamische Bewertung von KI-Agenten für offene Fachaufgaben
Die Bewertung von KI-Agenten in offenen, professionellen Aufgaben stellt ein klassisches Spannungsfeld zwischen Strenge und Flexibilität da…
arXiv – cs.AI