Forschung
LLM‑unterstützte Theoremprüfung: miniF2F‑Dafny erreicht 44,7 % Lösungen
Mit großer Begeisterung stellen wir miniF2F‑Dafny vor – die erste Übersetzung des mathematischen Reasoning‑Benchmarks miniF2F in den automa…
arXiv – cs.LG