Dirichlet Prior Augmentation: Mehr Realismus in Getreideklassifikation

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Landwirtschaft sind die Daten für die Klassifikation von Feldfrüchten häufig stark unausgewogen und folgen einer langen Schwanzverteilung. Gleichzeitig sind beschriftete Datensätze knapp und teuer zu beschaffen. Um mit diesen begrenzten Daten umzugehen, werden Trainingssets in der Regel künstlich ausgeglichen – besonders im Few‑Shot‑Learning. Dieses Vorgehen widerspricht jedoch den realen Bedingungen und führt zu einer Verschiebung zwischen Trainings- und Testlabelverteilungen, die die Generalisierbarkeit des Modells stark beeinträchtigt.

Um dieses Problem zu lösen, stellt die neue Studie die Methode „Dirichlet Prior Augmentation“ (DirPA) vor. Dabei wird die wahre, unbekannte Verteilung der Zieldomäne als Dirichlet‑verteilte Zufallsvariable modelliert und während des Trainings aktiv simuliert. Auf diese Weise wird ein proaktiver Prior‑Augmentierungsprozess in das Few‑Shot‑Training integriert, der die Modellparameter an die tatsächlichen, unausgewogenen Bedingungen anpasst.

Experimentelle Ergebnisse zeigen, dass DirPA die Entscheidungsgrenze gezielt verschiebt und den Trainingsprozess stabilisiert, indem es als dynamischer Feature‑Regularizer wirkt. Damit bietet die Methode einen vielversprechenden Ansatz, um die Leistung von Getreideklassifikationsmodellen in realen, datenarmen Szenarien deutlich zu verbessern.

Ähnliche Artikel