Robuste Statistik: LLMs zuverlässig prüfen trotz fehlerhafter Richter
In einer wegweisenden Studie wird ein neues Hypothesentestverfahren vorgestellt, das es ermöglicht, die Zuverlässigkeit großer Sprachmodelle (LLMs) auch dann zu prüfen, wenn die Bewertenden – die sogenannten „Richter“ –…