Feature Engineering schlägt Deep Learning bei automatischer Münzbewertung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Eine neue Studie aus dem arXiv-Repository stellt die weit verbreitete Annahme in Frage, dass Deep‑Learning-Modelle immer die besseren Ergebnisse liefern. Im Fokus steht die automatische Bewertung von Saint‑Gaudens Double‑Eagle‑Goldmünzen, bei denen Experten 1 785 Münzen klassifiziert haben.

Die Forscher haben drei Ansätze verglichen: ein auf 192 speziell entwickelten Merkmalen basierendes künstliches neuronales Netzwerk (ANN), ein hybrides Convolutional Neural Network (CNN) mit EfficientNetV2 und ein klassisches Support Vector Machine (SVM). Die Merkmale des ANN wurden aus Sobel‑Kantenerkennung und HSV‑Farbanalyse extrahiert, wodurch das Modell gezielt Münz‑Expert*innen‑Kenntnisse einbezieht.

Die Ergebnisse sind eindeutig: Das ANN erzielte 86 % exakte Übereinstimmungen mit den Expertenbewertungen und 98 % innerhalb einer Toleranz von drei Stufen. Im Gegensatz dazu erreichten das CNN und das SVM lediglich 31 % bzw. 30 % exakte Treffer, weil sie größtenteils die am häufigsten vorkommende Bewertung erraten. Obwohl das CNN bei breiteren Toleranzmaßen besser abschneidet, liegt dies an einer Regressions‑Durchschnittsbildung, die die eigentliche Genauigkeit verschleiert.

Die Studie zeigt, dass bei weniger als 2 000 Beispielen und stark unausgeglichenen Klassen die Einbindung von Expertenwissen durch gezielte Feature‑Engineering-Methoden deutlich bessere Ergebnisse liefert als komplexe Deep‑Learning‑Modelle. Dieser Befund dürfte auch für andere Nischenanwendungen mit knappen Daten und hohem Fachwissen von Bedeutung sein.

Ähnliche Artikel