Forschung
Robuste Statistik: LLMs zuverlässig prüfen trotz fehlerhafter Richter
In einer wegweisenden Studie wird ein neues Hypothesentestverfahren vorgestellt, das es ermöglicht, die Zuverlässigkeit großer Sprachmodell…
arXiv – cs.LG