Microsoft präsentiert VibeVoice-Realtime: Text‑zu‑Sprache mit Streaming‑Input
Anzeige
Microsoft hat das neue Modell VibeVoice-Realtime‑0.5B vorgestellt, das Echtzeit‑Text‑zu‑Sprache mit Streaming‑Input ermöglicht.
Das Modell kann bereits nach etwa 300 ms mit der Sprachausgabe beginnen, was besonders wichtig ist, wenn ein Sprachmodell noch weiter Text generiert.
VibeVoice‑Realtime ist ideal für Agenten‑Anwendungen und Live‑Narrationen von Daten, da es lange Sprachsequenzen zuverlässig erzeugt.
Microsoft betont, dass das Modell leichtgewichtig ist und sich nahtlos in bestehende Systeme integrieren lässt.
Ähnliche Artikel
MarkTechPost
•
Microsoft präsentiert VibeVoice-1.5B: TTS mit 90 Minuten Audio und vier Stimmen
The Register – Headlines
•
Microsoft meldet Hunderte gehackter Systeme durch React2Shell-Exploits
The Register – Headlines
•
GitHub startet Gebühren für eigene Hardware bei Actions Runners
The Register – Headlines
•
Microsoft-Updates stören MSMQ auf älteren Windows-Systemen
Analytics Vidhya
•
8 Möglichkeiten mit Microsofts MarkItDown-Bibliothek
The Register – Headlines
•
Microsoft RasMan DoS 0‑Tag erhält inoffiziellen Patch – Exploit im Umlauf