EntWorld: Benchmark für verifizierbare Unternehmens‑GUI‑Agenten
Mit dem neuen Benchmark EntWorld eröffnet die Forschung ein umfassendes Testfeld für KI‑Agenten, die in komplexen Unternehmensumgebungen arbeiten sollen. Im Gegensatz zu bisherigen Datensätzen, die sich vorwiegend auf Konsumentenszenarien wie Online‑Shopping oder Reisebuchungen konzentrieren, deckt EntWorld die anspruchsvollen Abläufe von Enterprise‑Systemen ab.