Neue Messgröße für KI‑Unlearning deckt Lücken offener Modelle auf
Aktuelle Kennzahlen zur Bewertung von KI‑Unlearning prüfen, ob ein Modell auf Basis von Referenzantworten oder Klassifikator‑Ausgaben „vergessen“ hat. Diese Vorgehensweise lässt jedoch systematische Blindstellen entstehen: Modelle können scheinbar erfolgreich sein, behalten aber unerwünschtes Wissen, das über alternative Eingaben oder Angriffe zugänglich bleibt.