SafePro: Benchmark prüft Sicherheit professioneller KI-Agenten
In der Forschung zu KI-Agenten hat sich ein neues Tool namens SafePro etabliert, das die Sicherheit von KI-Systemen in komplexen, professionellen Aufgaben prüft. Während frühere Tests meist einfache Alltagsaufgaben abdeckten, konzentriert sich SafePro auf hochkomplexe Szenarien aus verschiedenen Fachbereichen, in denen Fehler schwerwiegende Folgen haben können.