NVIDIA präsentiert Nemotron Speech ASR: Spracherkennung für geringe Latenz
NVIDIA hat sein neuestes Streaming‑Transkriptionsmodell „Nemotron Speech ASR“ vorgestellt, das speziell für Anwendungen mit niedriger Latenz wie Sprachagenten und Live-Untertitelungen entwickelt wurde. Das Modell ist als Open‑Source‑Checkpoint nvidia/nemotron-speech-streaming-en-0.6b auf Hugging Face verfügbar und richtet sich an Entwickler, die Echtzeit‑Spracherkennung auf modernen NVIDIA‑GPUs einsetzen wollen.