<p>DSA-Tokenizer trennt Sprachdaten in semantische und akustische Tokens</p> <p>Ein neuer Ansatz für die Tokenisierung von Sprache, der die Grenzen zwischen semantischem Inhalt und akustischem Stil aufbricht, wurde vorgestellt. Der DSA-Tokenizer (Disentangled Semantic‑Acoustic Tokenizer) löst das lange bestehende Problem, dass bisherige Tokenizer entweder nur semantische Informationen erfassen, die akustische Merkmale untrennbar mit dem Inhalt verknüpfen oder eine unvollständige Trennung zwischen beiden Kom

arXiv – cs.AI Original
Anzeige