Neue Benchmarks für Sprachmodelle neu gedacht: Fokus auf wissenschaftlichen Fortschritt
In einer kürzlich veröffentlichten Studie auf arXiv wird ein neues Konzept für die Bewertung von Sprachmodellen vorgestellt, das die bisher vorherrschende Praxis, statische Aufgaben zu nutzen, hinterfragt. Statt auf ber…