Testzeit-Training steigert Leistung von LLMs mit langen Kontexten
Mit den neuesten Fortschritten in Training und Architektur können große Sprachmodelle inzwischen Millionen von Tokens im Kontext verarbeiten. In der Praxis nutzen sie jedoch oft nur einen Bruchteil dieser Kapazität. For…