KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “SofT-GRPO”

SofT-GRPO: Soft-Thinking-LLMs übertreffen klassische Token-basierte RL-Methoden

Ein neuer Ansatz namens SofT-GRPO hat die Forschung im Bereich der großen Sprachmodelle (LLMs) vorangetrieben, indem er das Soft-Thinking-P…

arXiv – cs.AI 11.11.2025 05:00