Verbesserung der automatischen Spracherkennung durch integrierte Rausch-Erkennung
Eine neue Studie zeigt, wie die automatische Spracherkennung durch die direkte Einbindung von Rausch-Erkennungskomponenten deutlich verbessert werden kann. Der Ansatz baut auf dem bekannten wav2vec2‑Framework auf und erweitert es um ein dediziertes Modul zur Rauschidentifikation, das gleichzeitig mit der Sprachtranskription arbeitet.