LLM‑unterstützte Theoremprüfung: miniF2F‑Dafny erreicht 44,7 % Lösungen
Mit großer Begeisterung stellen wir miniF2F‑Dafny vor – die erste Übersetzung des mathematischen Reasoning‑Benchmarks miniF2F in den automatisierten Theoremprüfer Dafny. Bislang existierte das Benchmark ausschließlich i…