InfoDensity: Mehrwert durch kompakte, informationsreiche Beweiswege
In der Forschung zu großen Sprachmodellen (LLMs) wird zunehmend erkannt, dass lange, redundante Beweiswege nicht nur die Rechenzeit erhöhen, sondern auch die Qualität der Zwischenschritte schwächen. Traditionelle Verstärkungslernansätze konzentrieren sich meist auf die Kürze der Endantwort, vernach…