Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Verifier”
Forschung

<p>Die neue 4/δ‑Grenze liefert für LLM‑Verifikationssysteme ein solides theoretisches Fundament: Sie garantiert die Terminierung und Konvergenz jeder Iteration, solange die Fehler‑Reduktionswahrscheinlichkeit δ positiv ist. Der dazu entwickelte LLM‑Verifier‑Konvergenztheorem modelliert die Interaktion zwischen Sprachmodell und Verifikator als diskrete Zeit‑Markov‑Kette und zeigt, dass die erwartete Anzahl an Durchläufen höchstens 4/δ beträgt.</p>

Um die Theorie zu prüfen, wurden über 90.000 Simulationen durchgeführt. Alle Runs erreichten erfolgreich den Verified‑Zustand, und die geme…
arXiv – cs.AI
Forschung

<h1>Neuer Explanatory Verifier steigert Genauigkeit von KI-Logiktests</h1> <p>Wissenschaftler haben einen innovativen „Explanatory Verifier“ entwickelt, der die Leistungsfähigkeit von KI‑Modellen beim Lösen komplexer Aufgaben deutlich erhöht. Durch den Einsatz von Reinforcement‑Learning (GRPO) erzeugt der Verifier nicht nur präzise Vertrauenswerte, sondern liefert auch verständliche natürliche Spracherklärungen zu den vorgeschlagenen Lösungen.</p> <p>Traditionelle Test‑zeit‑Strategien wie „best‑of‑n“ oder S

arXiv – cs.AI