Forschung
Testzeit-Training steigert Leistung von LLMs mit langen Kontexten
Mit den neuesten Fortschritten in Training und Architektur können große Sprachmodelle inzwischen Millionen von Tokens im Kontext verarbeite…
arXiv – cs.LG