SpeechWeave: Automatisierte, mehrsprachige TTS‑Datengenerierung
Für die Ausbildung von Text‑zu‑Speech‑Modellen ist ein umfangreiches und vielfältiges Datenset unerlässlich. Traditionelle Quellen stoßen jedoch an Grenzen: Domain‑spezifische Inhalte sind selten, Lizenzfragen erschweren die Nutzung und die Skalierbarkeit bleibt begrenzt. Auch große Sprachmodelle liefern häufig wiederholende Texte, die nicht die nötige Variation aufweisen.