Sicherheitsgates versagen – Lipschitz-Ball-Verifikator überzeugt
Eine neue Untersuchung auf arXiv (2604.00072v1) stellt die Frage, ob Klassifikator-basierte Sicherheitsgates zuverlässig die Kontrolle über KI-Systeme behalten können, wenn diese sich über hunderte Iterationen selbst verbessern. Die Ergebnisse sind eindeutig: Alle getesteten Klassifikatoren – von M…