Framework TMLC verbessert lange Schwanz‑Klassifikation in Multi‑View‑Umgebungen
In der Forschung zu Klassifikationsproblemen mit stark unausgeglichenen Klassen wurde bisher vor allem das Ein‑View‑Szenario untersucht. Das neue Papier „Trusted Multi‑view Long‑tailed Classification“ (TMLC) schließt diese Lücke und präsentiert ein robustes Verfahren für die lange Schwanz‑Klassifikation in Multi‑View‑Umgebungen.
Der Kern von TMLC besteht aus zwei innovativen Komponenten: einer Konsens‑Aggregationsmethode, die sich an der Sozialen Identitätstheorie orientiert, und einem Modul zur Erzeugung von Pseudo‑Daten. Die Aggregationsmethode bündelt die Meinungen mehrerer Ansichten und lenkt die Entscheidungsfindung in die Richtung, die von der Mehrheit der Gruppe bevorzugt wird.
Zur Bewältigung der Klassenungleichheit wurde ein neuer Distanz‑Metrik entwickelt, die den klassischen SMOTE‑Algorithmus für Multi‑View‑Daten anpasst. Ergänzt wird dies durch ein Unsicherheits‑gesteuertes Daten‑Generierungsmodul, das hochwertige Pseudo‑Daten erzeugt und damit die negativen Auswirkungen der Ungleichheit reduziert.
Umfangreiche Experimente an langen Schwanz‑Multi‑View‑Datensätzen zeigen, dass TMLC die Leistung signifikant steigert. Der komplette Code ist öffentlich verfügbar unter https://github.com/cncq-tang/TMLC.