SABER: Token‑budgetierte LLM‑Reasoning reduziert Kosten um 65 %
Die neue Methode SABER (Switchable and Balanced Training for Efficient LLM Reasoning) nutzt ein Reinforcement‑Learning‑Framework, um große Sprachmodelle (LLMs) mit token‑budgetierter, nutzerkontrollierbarer Argumentatio…