TML-Bench: Neuer Tabellengrenzwert für autonome Data-Science-Agenten
Autonome Coding‑Agenten können in kurzer Zeit starke Baselines für tabellarische Aufgaben erzeugen – ähnlich wie bei Kaggle‑Wettbewerben. Der praktische Nutzen hängt jedoch stark davon ab, ob die Agenten end‑to‑end korr…