Forschung
TAM Bench: Automatisierte ML‑Benchmarks für LLM‑Agenten
Mit dem neuen Benchmark TAM Bench wird die Bewertung von großen Sprachmodellen (LLMs) in End‑to‑End‑Machine‑Learning‑Workflows revolutionie…
arXiv – cs.AI