Transsion präsentiert 3‑Stufen‑ASR‑System: 9,83 % Fehlerquote in 11 Sprachen
Transsion hat ein neues mehrsprachiges ASR‑System vorgestellt, das im Track 1 der MLC‑SLM 2025‑Challenge eingesetzt wurde. Das System kombiniert drei zentrale Bausteine: einen festgelagerten Whisper‑large‑v3‑Encoder, ei…
- Transsion hat ein neues mehrsprachiges ASR‑System vorgestellt, das im Track 1 der MLC‑SLM 2025‑Challenge eingesetzt wurde.
- Das System kombiniert drei zentrale Bausteine: einen festgelagerten Whisper‑large‑v3‑Encoder, einen lernbaren Adaptor mit Linear‑ReLU‑Linear‑Transformationen zur Ausrich…
- Durch die Kombination von vortrainierten Modellen und gezieltem Feintuning erreichte das System eine Wort‑/Zeichen‑Fehlerquote von 9,83 % über 11 Sprachen und belegte de…
Transsion hat ein neues mehrsprachiges ASR‑System vorgestellt, das im Track 1 der MLC‑SLM 2025‑Challenge eingesetzt wurde.
Das System kombiniert drei zentrale Bausteine: einen festgelagerten Whisper‑large‑v3‑Encoder, einen lernbaren Adaptor mit Linear‑ReLU‑Linear‑Transformationen zur Ausrichtung von Sprach‑ und Textrepräsentationen und ein frozen Qwen2.5‑7B‑Instruct‑LLM, das mit LoRA‑Modulen für die kontextuelle Sprachdekodierung optimiert wurde.
Durch die Kombination von vortrainierten Modellen und gezieltem Feintuning erreichte das System eine Wort‑/Zeichen‑Fehlerquote von 9,83 % über 11 Sprachen und belegte den dritten Platz unter allen Teilnehmern.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.