Forschung
LiveMedBench: Kontaminationsfreies, wöchentlich aktualisiertes Med‑Benchmark
Die neue Plattform LiveMedBench setzt neue Maßstäbe für die Bewertung großer Sprachmodelle (LLMs) im medizinischen Bereich. Sie löst zwei z…
arXiv – cs.AI