GIFT: Globale Optimierung nach dem Training durch Gibbs-Initialisierung
Ein neues Verfahren namens GIFT (Gibbs Initialization with Finite Temperature) verspricht, die Leistung von Large Reasoning Models (LRMs) nach dem Training entscheidend zu steigern. Im Gegensatz zum herkömmlichen Ansatz…