Forschung arXiv – cs.AI

KI-gestützte Datenqualitätsverwaltung in ERP-Systemen: Erfolgreiche Umsetzung

Unternehmen, die große ERP‑Systeme betreiben, stehen häufig vor der Herausforderung, hunderte Tausend Mitarbeiterdaten sauber und konsistent zu halten. In einer aktuellen Studie wurde ein End‑to‑End‑Ansatz entwickelt, d…

≈2 Min. Lesezeit Originalquelle
Kernaussagen
Das nimmst du aus dem Beitrag mit
  • Unternehmen, die große ERP‑Systeme betreiben, stehen häufig vor der Herausforderung, hunderte Tausend Mitarbeiterdaten sauber und konsistent zu halten.
  • In einer aktuellen Studie wurde ein End‑to‑End‑Ansatz entwickelt, der genau diese Problematik adressiert und in einem produktiven Umfeld mit 240.000 Mitarbeiterkonten üb…
  • Der Ansatz kombiniert eine mehrstufige Bereinigungs‑Pipeline mit KI‑unterstützter SQL‑Generierung.

Unternehmen, die große ERP‑Systeme betreiben, stehen häufig vor der Herausforderung, hunderte Tausend Mitarbeiterdaten sauber und konsistent zu halten. In einer aktuellen Studie wurde ein End‑to‑End‑Ansatz entwickelt, der genau diese Problematik adressiert und in einem produktiven Umfeld mit 240.000 Mitarbeiterkonten über sechs Monate hinweg eingesetzt wurde.

Der Ansatz kombiniert eine mehrstufige Bereinigungs‑Pipeline mit KI‑unterstützter SQL‑Generierung. Zunächst werden Daten aus Microsoft SQL Server in PostgreSQL synchronisiert, wobei Übersetzungen normalisiert, Rechtschreibfehler korrigiert und Duplikate entfernt werden. Anschließend nutzt ein Retrieval‑Augmented‑Generation‑Framework GPT‑4o, um natürliche Sprachabfragen in Türkisch, Russisch und Englisch in validierte SQL‑Statements zu übersetzen. Die Orchestrierung erfolgt über LangChain, die Suche nach ähnlichen Vektoren wird mit FAISS realisiert und die Genauigkeit wird durch Few‑Shot‑Learning mit über 500 geprüften Beispielen gesteigert.

Die Evaluation zeigt beeindruckende Ergebnisse: 92,5 % der generierten Abfragen sind gültig, 95,1 % entsprechen dem Schema und 90,7 % erreichen semantische Genauigkeit bei 2.847 produktiven Abfragen. Der Durchlaufzeitunterschied ist enorm – von 2,3 Tagen auf unter 5 Sekunden. Gleichzeitig bleibt die Verfügbarkeit bei 99,2 % und GPT‑4o reduziert die Latenz um 46 % sowie die Kosten um 68 % im Vergleich zu GPT‑3,5. Nutzer bewerten die Lösung mit 4,3 von 5 Sternen.

Diese modulare Architektur demonstriert, dass KI‑basierte Datenqualitätsverwaltung in großen ERP‑Systemen nicht nur machbar, sondern auch wirtschaftlich und benutzerfreundlich ist. Sie liefert ein reproduzierbares Framework, das Unternehmen ermöglicht, ihre Datenintegrität auf Enterprise‑Skala zu sichern und gleichzeitig operative Effizienz und Kosteneinsparungen zu realisieren.

Einordnen in 60 Sekunden

Welche Linse du auf diese Meldung legen solltest

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

Was veraendert sich praktisch?
Ist das eher Signal, Produkt oder nur kurzfristiger Hype?
Begriffe zum Einordnen

Kontext ohne Glossar-Suche

ERP
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
KI-unterstützte SQL-Generierung
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Retrieval-Augmented-Generation
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
arXiv – cs.AI
Diese Quelle setzt den Ausgangspunkt fuer die Meldung. Pruefe immer, ob sie eher Forschung, Produktmarketing oder Praxisperspektive liefert.
Naechste Schritte

Aehnliche Entwicklungen zum Weiterlesen