Neue Methode senkt Rechenaufwand bei Sprachmodellen
Sprachmodelle, die beim Lösen von Aufgaben lange Gedankengänge ausgeben, sind oft sehr leistungsfähig – aber auch extrem rechenintensiv. Eine neue Technik namens Truncated‑Reasoning Self‑Distillation (TRSD) reduziert di…