Mehrdimensionale Schwellenoptimierung verbessert Mehrklassenklassifikation
Ein neues Papier auf arXiv präsentiert einen Schwellen-basierten Ansatz für die Mehrklassenklassifikation, der die klassische argmax-Regel erweitert.
Anstelle der probabilistischen Interpretation der Softmax-Ausgaben wird ein geometrischer Ansatz auf dem mehrdimensionalen Simplex verwendet, wobei die Klassifikation von einem mehrdimensionalen Schwellenwert abhängt.
Durch diese Perspektivwechsel kann jede trainierte Klassifikationsnetzwerk nachträglich optimiert werden, indem die Schwellenwerte angepasst werden – ein Verfahren, das bisher vor allem im binären Setting genutzt wurde.
Die Experimente zeigen, dass die multidimensionale Schwellenanpassung die Leistung über verschiedene Netzwerke und Datensätze hinweg steigert.
Darüber hinaus wird eine Mehrklassen-ROC-Analyse eingeführt, die auf sogenannten ROC-Clouds basiert – den erreichbaren (FPR,TPR)-Punkten eines einzigen Schwellenwerts – und diese mittels eines Distance-From-Point (DFP)-Scores zum Idealpunkt (0,1) zusammenfasst.
Diese Methode bietet eine konsistente Alternative zu herkömmlichen One-vs-Rest-Kurven und erklärt die beobachteten Verbesserungen durch Schwellenanpassung.