Go-UT-Bench: neues Dataset für LLM-gestützte Unit-Test-Generierung in Go
Die Entwicklung von Sprachmodellen für Code hat in den letzten Jahren enorme Fortschritte gemacht, doch ein entscheidendes Problem bleibt: die Trainingsdaten sind stark unausgewogen. Während Open-Source-Code in großen Mengen verfügbar ist, fehlen systematisch Daten zu praxisnahen Softwareentwicklungsaufgaben – besonders in weniger verbreiteten Sprachen wie Golang. Das Ergebnis: Modelle glänzen bei Autovervollständigung, aber bei echten Entwickleraufgaben wie der Generierung von Unit-Tests hinken sie hinterher.