Apriori-Algorithmus automatisiert thematische Gruppierung von Hadith-Texten

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Ein neues arXiv-Papier zeigt, wie der Apriori-Algorithmus ohne menschliche Kennzeichnung Hadith-Texten in sinnvolle Themenbereiche sortiert. Die Studie reagiert auf die wachsende Digitalisierung islamischer Texte und nutzt die indonesische Übersetzung der Hadithe von Bukhari als Datensatz.

Vor der Analyse werden die Texte standardisiert: Groß- und Kleinschreibung werden vereinheitlicht, Satzzeichen entfernt, Tokenisierung durchgeführt, Stopwörter eliminiert und Stemming angewendet. Anschließend wird mit dem Apriori-Algorithmus eine Assoziationsregel-Analyse unter Verwendung von Support, Confidence und Lift durchgeführt.

Die Ergebnisse zeigen klare Muster, etwa die Verbindung zwischen „rakaat-prayer“, „verse-revelation“ und „hadith-story“. Diese Muster spiegeln die Themen Gottesdienst, Offenbarung und Hadith-Erzählung wider und beweisen, dass der Apriori-Algorithmus latente semantische Beziehungen zuverlässig aufdecken kann.

Die Arbeit unterstreicht die Rolle von datengetriebenen Methoden in der digitalen Islamforschung und trägt zur Entwicklung technikorientierter Lernsysteme bei.

Ähnliche Artikel