MechDetect: Fehlerursachen in Daten erkennen – ein neuer Ansatz

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Die Überwachung der Datenqualität bleibt eine zentrale Herausforderung in modernen Informationssystemen. Während zahlreiche Verfahren zur Erkennung von Datenfehlern oder -verschiebungen existieren, untersuchen nur wenige die zugrunde liegenden Mechanismen der Fehlererzeugung. Das Verständnis, wie Fehler entstehen, kann entscheidend sein, um sie nachzuverfolgen und zu beheben.

MechDetect, ein neuer Algorithmus, baut auf etablierten statistischen Ansätzen zur Analyse fehlender Werte auf. Er nutzt maschinelles Lernen, um anhand eines Datensatzes und eines zugehörigen Fehler-Masks zu bestimmen, ob die Fehler datenabhängig sind. Der Ansatz erweitert bestehende Methoden zur Erkennung von Fehlermustern und lässt sich leicht auf andere Fehlerarten übertragen, sofern ein entsprechendes Masken-Label vorliegt. In Experimenten mit etablierten Benchmark-Datensätzen konnte die Wirksamkeit von MechDetect überzeugend demonstriert werden.

Ähnliche Artikel