PaTAS: Paralleles Trust-Assessment-System für KI-Netzwerke
In der heutigen Zeit, in der künstliche Intelligenz in sicherheitskritischen Bereichen eingesetzt wird, ist die Vertrauenswürdigkeit von Modellen entscheidend. Traditionelle Kennzahlen wie Genauigkeit oder Präzision erfassen jedoch weder Unsicherheit noch die Zuverlässigkeit von Vorhersagen, besonders wenn Modelle Angriffen oder degradierter Daten ausgesetzt sind.
Das neue Framework PaTAS (Parallel Trust Assessment System) löst dieses Problem, indem es Vertrauen in neuronale Netzwerke mithilfe von Subjective Logic modelliert und überträgt. PaTAS arbeitet parallel zur üblichen neuronalen Berechnung und nutzt dafür sogenannte Trust Nodes und Trust Functions, die Vertrauen auf Eingabe-, Parameter- und Aktivierungsebene weitergeben.
Während des Trainings aktualisiert PaTAS die Zuverlässigkeit der Parameter über einen Parameter Trust Update-Mechanismus. Bei der Inferenz wird mit der Inference-Path Trust Assessment (IPTA)-Methode ein instanzspezifisches Vertrauensmaß berechnet, das die tatsächliche Zuverlässigkeit des Modells widerspiegelt.
Experimentelle Ergebnisse auf realen und adversarialen Datensätzen zeigen, dass PaTAS interpretable, symmetrische und konvergente Vertrauensschätzungen liefert. Diese ergänzen die klassische Genauigkeit und decken Lücken in der Zuverlässigkeit auf, etwa bei verunreinigten, voreingenommenen oder unsicheren Daten. PaTAS kann zwischen harmlosen und adversarialen Eingaben unterscheiden und erkennt Fälle, in denen das Modellvertrauen von der tatsächlichen Zuverlässigkeit abweicht.
Durch die transparente und quantifizierbare Vertrauenslogik bietet PaTAS eine solide Grundlage, um die Zuverlässigkeit von KI-Modellen über den gesamten Lebenszyklus hinweg systematisch zu bewerten.