Forschung
ART: Benchmark für medizinische KI-Agenten – Action‑basierte Entscheidungsfindung
Die neue Studie „ART: Action-based Reasoning Task Benchmarking for Medical AI Agents“ präsentiert einen wegweisenden Test für medizinische…
arXiv – cs.AI