Entropiebasierte Ensemble-Methode schützt Adversarial-Angriffen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In einer brandneuen Veröffentlichung auf arXiv (2602.05026v1) stellen die Autoren die fundamentalen Gesetze der Lern‑Dynamik vor. Dabei geht es um die Erhaltungsgesetze und die stetige Abnahme der Gesamtentropie, die das Verhalten von Lernalgorithmen prägen.

Auf dieser theoretischen Basis entwickeln die Forscher eine lebenslange Ensemble‑Lernmethode, die ausschließlich auf Entropie‑Messungen beruht. Das Verfahren kombiniert Modelle, die jeweils auf saubere und auf adversariale Daten spezialisiert sind, und nutzt dabei ein innovatives Immunisierungskonzept.

Die Wirksamkeit der Methode wird anhand des CIFAR‑10 Datensatzes getestet, wobei Transfer‑basierte adversariale Angriffe simuliert werden. Im Vergleich zu einem einfachen Durchschnitt der beiden Modelle erzielt die neue Logifold‑Strategie deutlich höhere Genauigkeiten – besonders bei starken Störungen.

Diese Ergebnisse zeigen, dass die Kombination aus theoretischer Fundierung und praktischer Umsetzung einen vielversprechenden Ansatz bietet, um maschinelles Lernen widerstandsfähiger gegen gezielte Angriffe zu machen. Die Arbeit liefert damit einen wichtigen Beitrag zur Sicherheit von KI‑Systemen.

Ähnliche Artikel