Forschung
Einheitliches Sprachmodell: Autoregressive Transformer für TTS, ASR und VC
Ein neues Forschungsprojekt präsentiert General-Purpose Audio (GPA), ein einheitliches Audio‑Fundamentmodell, das Text‑zu‑Sprache (TTS), au…
arXiv – cs.AI