Forschung
Physiologen-Diskrepanzen im HealthBench: Nur 3 % erklärbar – Struktur entscheidend
Eine neue Analyse des HealthBench‑Datensatzes, der medizinische KI‑Bewertungen sammelt, hat die Ursachen für die häufig auftretende Meinung…
arXiv – cs.AI