StepFun AI präsentiert Step‑Audio‑R1: Audio‑LLM mit Testzeit‑Computing‑Skalierung
Aktuelle Audio‑KI‑Modelle zeigen häufig schlechtere Ergebnisse, wenn sie längere Gedankengänge generieren, anstatt ihre Entscheidungen direkt auf dem Klang zu basieren. Das Forschungsteam von StepFun hat nun Step‑Audio‑R1 vorgestellt – ein neues Audio‑LLM, das speziell für die Skalierung bei Testzeit‑Computing entwickelt wurde. Durch gezielte Optimierungen demonstriert Step‑Audio‑R1, dass der Genauigkeitsverlust bei längeren „Chain‑of‑Thought“-Antworten nicht mehr auftritt, sondern die KI ihre Analyse stärker an den eigentlichen Audiodaten ausrichtet.