Einheitliches Sprachmodell: Autoregressive Transformer für TTS, ASR und VC
Ein neues Forschungsprojekt präsentiert General-Purpose Audio (GPA), ein einheitliches Audio‑Fundamentmodell, das Text‑zu‑Sprache (TTS), automatische Spracherkennung (ASR) und Sprachumwandlung (VC) in einer einzigen, au…