StepFun AI präsentiert Step‑Audio‑R1: Audio‑LLM mit Testzeit‑Computing‑Skalierung

MarkTechPost Original ≈1 Min. Lesezeit
Anzeige

Aktuelle Audio‑KI‑Modelle zeigen häufig schlechtere Ergebnisse, wenn sie längere Gedankengänge generieren, anstatt ihre Entscheidungen direkt auf dem Klang zu basieren. Das Forschungsteam von StepFun hat nun Step‑Audio‑R1 vorgestellt – ein neues Audio‑LLM, das speziell für die Skalierung bei Testzeit‑Computing entwickelt wurde. Durch gezielte Optimierungen demonstriert Step‑Audio‑R1, dass der Genauigkeitsverlust bei längeren „Chain‑of‑Thought“-Antworten nicht mehr auftritt, sondern die KI ihre Analyse stärker an den eigentlichen Audiodaten ausrichtet.

Ähnliche Artikel