Neue Methode verbessert Vorhersage von Pass@k in großen Sprachmodellen
Die Bewertung der Fähigkeiten und Risiken von Spitzentechnologien im Bereich der künstlichen Intelligenz ist ein zentrales Forschungsfeld. Neueste Studien zeigen, dass wiederholtes Sampling von Modellen sowohl deren Lei…