Hierarchische Kontaminationsprüfung: Sicherer Einsatz synthetischer Trainingsdaten
In der heutigen KI‑Entwicklung sind synthetische Daten unverzichtbar, um Basismodelle zu trainieren. Gleichzeitig gefährdet die Kontamination dieser Daten die Integrität von Benchmarks, denn Modelle können unbemerkt Benchmarkwissen übernehmen.