NVIDIA AI enthüllt größtes Open-Source-Sprachdatenset und Spitzenmodelle

MarkTechPost Original ≈1 Min. Lesezeit
Anzeige

NVIDIA AI hat mit der Veröffentlichung von Granary einen Meilenstein in der Entwicklung mehrsprachiger Sprach‑KI gesetzt. Das neue Datenset ist das größte Open‑Source‑Projekt, das sich auf europäische Sprachen konzentriert und damit einen wichtigen Beitrag zur Förderung von ASR‑ und AST‑Forschung leistet.

Granary umfasst Millionen von Sprachaufnahmen in über 30 europäischen Sprachen, darunter auch viele, die bislang unterrepräsentiert waren. Durch die offene Lizenz können Forscher und Entwickler weltweit auf die Daten zugreifen und eigene Modelle trainieren, ohne Lizenzkosten oder Beschränkungen.

Zur Ergänzung des Datensatzes stellt NVIDIA zwei hochmoderne Modelle vor: Canary‑1b‑v2 für die automatische Spracherkennung und Parakeet‑tdt‑0.6b‑v3 für die Sprachübersetzung. Beide Modelle nutzen die neuesten Fortschritte in der Transformer‑Architektur und erzielen beeindruckende Genauigkeit bei einer Vielzahl von Sprachen.

Die Kombination aus Granary und den beiden Modellen schafft eine neue Plattform, die es ermöglicht, qualitativ hochwertige Sprachsysteme für europäische Sprachen zu entwickeln und gleichzeitig die Forschungsgemeinschaft zu stärken. NVIDIA AI setzt damit einen neuen Standard für offene, leistungsfähige Sprachressourcen.

Ähnliche Artikel