Neuer Ansatz für Testzeit-Anpassung: Geometrische Quantile für Architekturen

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Testzeit‑Anpassung (TTA) ist ein Verfahren, bei dem ein Klassifikator an Testdaten angepasst wird, deren Verteilung sich leicht von der Trainingsverteilung unterscheidet. Bisher konzentrierten sich die meisten TTA‑Methoden darauf, die Gewichte des Klassifikators zu verändern – ein Ansatz, der stark von der jeweiligen Netzwerkarchitektur abhängt und daher schwer übertragbar ist.

In der vorliegenden Arbeit wird ein architekturunabhängiger Ansatz vorgestellt: ein Adapter‑Netzwerk, das die Eingabebilder vorverarbeitet, bevor sie an den Klassifikator übergeben werden. Der Adapter wird mit einer neu definierten Quantil‑Verlustfunktion trainiert, die auf der Übereinstimmung hochdimensionaler geometrischer Quantile basiert. Durch diese Methode wird die Verteilungsverschiebung korrigiert, ohne die Kernarchitektur des Modells zu verändern.

Die Autoren liefern eine theoretische Begründung, die zeigt, dass unter geeigneten Bedingungen die Minimierung des Quantil‑Verlusts zum optimalen Adapter führt. Damit wird die Effektivität des Ansatzes nicht nur empirisch, sondern auch mathematisch untermauert.

Die Wirksamkeit des Verfahrens wurde auf den Datensätzen CIFAR10‑C, CIFAR100‑C und TinyImageNet‑C getestet. Dabei wurden sowohl klassische Convolutional‑Neural‑Networks als auch Transformer‑Modelle auf den ursprünglichen CIFAR10, CIFAR100 und TinyImageNet trainiert und anschließend mit dem Adapter auf die verschobenen Testdaten angepasst. Die Ergebnisse zeigen, dass der neue Ansatz die Leistung in allen getesteten Szenarien deutlich verbessert.

Ähnliche Artikel