Pass@k: Diagnosewerkzeug für RLVR, kein Optimierungsziel
Die Fähigkeit großer Sprachmodelle, komplexe mehrstufige Argumentationen zu lösen, steht im Mittelpunkt aktueller KI-Forschung. Um diese Kompetenz zu messen und zu verbessern, wird die Pass@k-Metrik häufig eingesetzt. Sie gibt an, wie wahrscheinlich es ist, dass mindestens eine korrekte Lösung in k unabhängigen Versuchen gefunden wird.