BiasSeeker: Kurzschlüsse im verschlüsselten Netzwerkverkehr aufdecken

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Welt der verschlüsselten Netzwerkverkehrsklassifikation haben vortrainierte Modelle, die direkt auf Rohbytes arbeiten, bemerkenswerte Ergebnisse erzielt. Doch sie leiden häufig an „Shortcut‑Learning“ – sie greifen auf trügerische Korrelationen zurück, die in realen Daten nicht bestehen. Traditionelle Ansätze zur Bias‑Erkennung sind meist modell‑spezifisch und passen nicht gut auf unterschiedliche Architekturen oder Einsatzszenarien.

Mit BiasSeeker wird das Spiel neu definiert. Das semi‑automatisierte, modell‑agnostische und datengetriebene Framework analysiert statistisch die Rohbytes eines Datensatzes und erkennt so kurzzeitige, umgebungsabhängige Merkmale, die die Generalisierung gefährden. Durch eine systematische Kategorisierung und gezielte Validierungsstrategien werden diese unerwünschten Features reduziert, ohne dabei wertvolle Informationen zu verlieren.

Die Leistungsfähigkeit von BiasSeeker wurde an 19 öffentlichen Datensätzen in drei Klassifikationsaufgaben getestet. Das Tool demonstriert, wie kontext‑bewusste Feature‑Auswahl und datensatz‑spezifische Diagnostik die Qualität von Modellen deutlich verbessern können. Es unterstreicht, dass die Auswahl der Merkmale ein bewusstes, situationsabhängiges Vorgehen sein muss – ein entscheidender Schritt vor dem eigentlichen Training.

Ähnliche Artikel