Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Lernkurve”
Forschung

<p>LLMs zeigen bei RLVR lineare Lernkurve – Extrapolation spart Rechenzeit</p> <p>Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) ist heute ein wesentlicher Bestandteil der Nachschulung großer Sprachmodelle. Im Gegensatz zum klassischen Supervised Fine‑Tuning erzeugt ein LLM bei RLVR mehrere Kandidaten und belohnt nur jene, die zu einer verifizierbar korrekten Endantwort führen. In der Praxis erfordert RLVR jedoch oft Tausende von Trainingsschritten, was enorme Rechenressourcen beansprucht – h

arXiv – cs.LG
Forschung

<p>LLMs als Prüfungs-Orakel für Solidity: GPT‑5 überzeugt bei Smart‑Contract‑Audit</p> <p>Die Sicherheit von Smart Contracts ist entscheidend, denn selbst kleine Fehler können zu erheblichen finanziellen Verlusten führen. Während klassische Bug‑Detection‑Tools häufig bekannte Schwachstellen erkennen, entstehen die meisten realen Angriffe durch Fehler in der Geschäftslogik des Vertrags. Formale Verifikationswerkzeuge wie SolCMC und der Certora Prover adressieren dieses Problem, stoßen jedoch an Lernkurven un

arXiv – cs.AI