Forschung
ManiBench: Benchmark für Visual-Logic Drift & Halluzinationen in Manim
Ein neues Benchmark-Tool namens ManiBench wurde vorgestellt, das die Leistungsfähigkeit von Sprachmodellen bei der Erzeugung von Manim‑Code…
arXiv – cs.AI