MedMT-Bench: LLMs im medizinischen Dialog – Messlatte für Langzeitverständnis
Ein neues Benchmark-Tool namens MedMT-Bench wurde vorgestellt, das die Leistungsfähigkeit von Large Language Models (LLMs) in medizinischen, mehrtägigen Gesprächen prüft. Das Ziel ist es, die Fähigkeit von KI-Systemen z…