Neues Benchmark-Dataset zur Bewertung von NLP- und RAG-Systemen im EU AI Act
Ein neues, öffentlich zugängliches Benchmark-Dataset wurde vorgestellt, das die Bewertung von NLP‑ und Retrieval‑Augmented‑Generation‑Systemen im Hinblick auf die Einhaltung des EU AI Act erleichtert. Das Projekt setzt auf Transparenz und Reproduzierbarkeit, um die Entwicklung von Compliance‑Tools…