Microsoft präsentiert VibeVoice-Realtime: Text‑zu‑Sprache mit Streaming‑Input
Anzeige
Microsoft hat das neue Modell VibeVoice-Realtime‑0.5B vorgestellt, das Echtzeit‑Text‑zu‑Sprache mit Streaming‑Input ermöglicht.
Das Modell kann bereits nach etwa 300 ms mit der Sprachausgabe beginnen, was besonders wichtig ist, wenn ein Sprachmodell noch weiter Text generiert.
VibeVoice‑Realtime ist ideal für Agenten‑Anwendungen und Live‑Narrationen von Daten, da es lange Sprachsequenzen zuverlässig erzeugt.
Microsoft betont, dass das Modell leichtgewichtig ist und sich nahtlos in bestehende Systeme integrieren lässt.
Ähnliche Artikel
MarkTechPost
•
Microsoft präsentiert VibeVoice-1.5B: TTS mit 90 Minuten Audio und vier Stimmen
The Register – Headlines
•
Microsoft beendet TLS 1.0/1.1 in Azure Storage – ab sofort TLS 1.2 Pflicht
The Register – Headlines
•
Microsoft beendet eigenständige SharePoint- und OneDrive-Pläne
The Register – Headlines
•
Windows‑Hibernationsfehler kehrt zurück: Patch Tuesday wie Groundhog Day
The Register – Headlines
•
Microsofts untypische Notfall-Updates werden immer üblicher
The Register – Headlines
•
NYC schaltet Microsoft‑Chatbot wegen Fehlern und Budgetkrise aus