LLM-Judges: Kalibrierung durch gezielte Rauschinterventionen
In der Forschung zu automatisierten Urteilsfindern kommen immer häufiger große Sprachmodelle (LLMs) zum Einsatz, insbesondere wenn nur wenige gelabelte Daten verfügbar sind. Diese Systeme sind jedoch stochastisch und ne…