Forschung
DevBench: Realistisches Benchmark für Code-Generierungsmodelle
Mit DevBench erhält die Forschung ein neues, auf Telemetrie basierendes Benchmark, das Large Language Models (LLMs) in realen Code‑Completi…
arXiv – cs.LG