Erste End-to-End-Pipeline für Handschriftenerkennung im alten Nepali
Forscher haben die erste komplette Pipeline für die Handschriftenerkennung (HTR) von alten nepalesischen Manuskripten vorgestellt – ein bedeutender Fortschritt für eine historisch wichtige, aber ressourcenarme Sprache.
Die Methode arbeitet zeilenweise und untersucht systematisch verschiedene Encoder‑Decoder-Architekturen sowie datenzentrierte Techniken. Das beste Modell erreicht dabei einen Charakterfehlerrate (CER) von 4,9 % und demonstriert damit eine hohe Genauigkeit bei der Transkription.
Zusätzlich wurden mehrere Decodierungsstrategien implementiert und token‑weise Fehleranalysen durchgeführt, um das Verhalten des Modells besser zu verstehen und typische Fehlerquellen zu identifizieren.
Obwohl das verwendete Datenset vertraulich bleibt, stellen die Autoren ihren Trainingscode, die Modellkonfigurationen und die Evaluationsskripte frei, um weitere Forschungen im Bereich HTR für historische, ressourcenarme Schriften zu fördern.