JADE: Dynamische Bewertung von KI-Agenten für offene Fachaufgaben
Die Bewertung von KI-Agenten in offenen, professionellen Aufgaben stellt ein klassisches Spannungsfeld zwischen Strenge und Flexibilität dar. Traditionelle, statische Rubriken bieten zwar reproduzierbare Kriterien, lass…