DRILL: Neue Methode verbessert semi‑supervised Regression durch Distillation

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Forschung zur semi‑supervised Regression (SSR) – der Vorhersage kontinuierlicher Werte mit möglichst wenig gelabelten Daten – hat die neue Methode DRILL für Aufsehen gesorgt. Sie kombiniert ein innovatives Distillationsverfahren mit einer cleveren Umwandlung des Regressionsproblems in eine Diskrete Verteilungs­schätzung (DDE), wodurch die zugrunde liegende Label‑Verteilung besser erfasst wird.

Traditionelle SSR‑Ansätze setzen stark auf Pseudo‑Labels und Konsistenz­regularisierung. Diese Verfahren sind jedoch anfällig für Fehler in den Pseudo‑Labels und neigen bei direkter Regression zu Überanpassung. DRILL löst dieses Problem, indem es die Regression in mehrere Buckets aufteilt und die Verteilung dieser Buckets modelliert. Dadurch wird die Lern­stabilität erhöht und das Risiko von Overfitting reduziert.

Ein zentrales Element von DRILL ist die Decoupled Distribution Alignment (DDA). Hierbei werden die Bucket‑Verteilungen des Lehrers und des Schülers aufeinander abgestimmt, sodass der Schüler robuste und generalisierte Kenntnisse aus dem Lehrer übernimmt. Das Ergebnis ist ein Modell, das nicht nur die Genauigkeit steigert, sondern auch besser auf neue Daten übertragbar ist.

Umfangreiche Experimente auf Datensätzen aus den Bereichen Computer Vision, Natural Language Processing, Audio‑ und Medizinanalyse zeigen, dass DRILL die Leistung bestehender Methoden deutlich übertrifft. Die Forschung liefert damit einen wichtigen Schritt in Richtung zuverlässigerer semi‑supervised Regression für vielfältige Anwendungen.

Ähnliche Artikel