QiMeng-NeuComBack: Self-Evolving Translation from IR to Assembly Code
Anzeige
Ähnliche Artikel
Towards Data Science
•
So entwickeln Sie leistungsstarke interne LLM-Benchmarks
arXiv – cs.AI
•
Neue Studie deckt stille Fehler in Multi-Agenten‑AI auf
arXiv – cs.AI
•
LLM-Tester CLAUSE: Benchmark zur Erkennung von Vertragsfehlern
arXiv – cs.LG
•
CudaForge: An Agent Framework with Hardware Feedback for CUDA Kernel Optimization
arXiv – cs.AI
•
Mechanics of Learned Reasoning 1: TempoBench, A Benchmark for Interpretable Deconstruction of Reasoning System Performance
arXiv – cs.AI
•
APTBench: Benchmarking Agentic Potential of Base LLMs During Pre-Training