Neue Methode verbessert Vorhersage von Pass@k in großen Sprachmodellen
Die Bewertung der Fähigkeiten und Risiken von Spitzentechnologien im Bereich der künstlichen Intelligenz ist ein zentrales Forschungsfeld. Neueste Studien zeigen, dass wiederholtes Sampling von Modellen sowohl deren Leistungsfähigkeit – etwa bei komplexen Rechen- und Programmieraufgaben – als auch ihre Gefährdungspotenziale – etwa durch Jailbreaks – deutlich steigert.