FormalProofBench: KI‑Modelle meistern formale Graduiertenbeweise
Ein neues Benchmark‑Set namens FormalProofBench wurde vorgestellt, um zu prüfen, ob KI‑Modelle in der Lage sind, mathematische Beweise auf Graduierten‑Ebene formal zu verifizieren. Dabei werden Aufgaben aus Prüfungen un…