CanaryBench: Testet Privatsphäre in Cluster‑Zusammenfassungen von Chat‑Daten
In der heutigen KI‑Welt werden große Mengen an Gesprächsdaten häufig analysiert, um Sicherheit, Governance und Produktqualität zu überwachen. Dabei werden Konversationen oft in Cluster gruppiert und anschließend kurze Textzusammenfassungen veröffentlicht. Obwohl die Rohdaten selbst nicht öffentlich zugänglich sind, können diese Zusammenfassungen dennoch sensible Informationen preisgeben, wenn sie persönliche Daten oder eindeutig identifizierbare Strings enthalten.