Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Transkription”
Forschung

<p>IRPAPERS: Benchmark für visuelle Dokumentensuche und Fragenbeantwortung</p> <p>Die neue Studie IRPAPERS liefert einen umfassenden Teststand für die Verarbeitung von wissenschaftlichen Dokumenten in Bildform. Im Gegensatz zu herkömmlichen Ansätzen, die auf OCR-Transkriptionen angewiesen sind, untersucht die Arbeit, wie moderne multimodale Modelle direkt aus Bilddaten zurückgreifen können.</p> <p>Der Datensatz umfasst 3.230 Seiten aus 166 wissenschaftlichen Arbeiten. Für jede Seite stehen sowohl das Origin

arXiv – cs.AI
Forschung

Leichtgewichtige Anpassung verbessert ASR bei Stottern – neue Studie enthüllt Sprachbias Eine aktuelle Veröffentlichung auf arXiv beleuchtet die anhaltenden Schwierigkeiten bei der automatischen Transkription von stotterndem Sprachmaterial. Trotz moderner End‑to‑End‑Spracherkennungssysteme bleiben Dysfluenzen und flüssigkeitsprägende Artefakte häufig unberücksichtigt, was zu nicht‑wörtlichen Aufzeichnungen führt, die für klinische und Forschungszwecke weniger wertvoll sind. Die Autoren stellen eine para

arXiv – cs.AI