DAJ: Neuer LLM‑Judge verbessert Codegenerierung bei Testzeit‑Skalierung
In der Codegenerierung wird die Qualität von Ergebnissen häufig durch Best‑of‑N‑Auswahl verbessert: Mehrere Kandidaten werden vom Basismodell erzeugt und der beste wird von einem LLM‑Judge ausgewählt. Doch die Ausbildun…