Dataset‑Poisoning‑Angriffe auf Behavior‑Cloning: Neue Studie zeigt Schwachstellen
Behavior Cloning (BC) ist ein weit verbreitetes Verfahren, um Entscheidungspolicies aus Expertendemonstrationen mittels überwachten Lernens zu trainieren. Da diese Modelle zunehmend in realen Systemen eingesetzt werden, ist ihre Robustheit ein zentrales Thema.
In der vorliegenden Arbeit wird erstmals untersucht, wie sauber‑beschriftete Backdoor‑Angriffe BC‑Policies gefährden können. Dabei wird ein Datensatz von Demonstrationen mit einem visuellen Trigger verseucht, der eine künstliche Korrelation erzeugt, die später im Testmodus ausgenutzt werden kann.
Die Autoren analysieren, wie die Anfälligkeit mit dem Anteil verseuchter Daten, der Stärke des Triggers und dessen Typ variiert. Zusätzlich wird ein neuer, auf Entropie basierender Test‑Time‑Trigger‑Angriff vorgestellt, der kritische Zustände identifiziert, in denen das Auslösen des Backdoors die Leistung am stärksten beeinträchtigt.
Die Ergebnisse zeigen, dass selbst bei minimal verseuchten Datensätzen BC‑Policies nahezu baseline‑ähnliche Leistungen erbringen, jedoch bei Einsatz des Backdoors stark degradieren. Dies unterstreicht die dringende Notwendigkeit, die Robustheit von BC‑Modellen zu verbessern, insbesondere wenn große Datensätze für cyber‑physische Systeme verwendet werden.
Videos und Code zur Studie sind unter https://sites.google.com/view/dataset-poisoning-in-bc verfügbar.