<h1>LLMs zeigen 'AI-MASLD': Leistungsabfall bei klinischen Texten</h1> <p>In einer neuartigen Studie wurden vier führende Large Language Models – GPT‑4o, Gemini 2.5, DeepSeek 3.1 und Qwen3‑Max – in simulierten, realen klinischen Szenarien getestet. Ziel war es, zu prüfen, wie gut die Modelle aus stark verrauschten Patientenbeschwerden die wesentlichen medizinischen Informationen extrahieren können und ob sie dabei einen funktionellen Abfall ähnlich der metabolischen Steatose des Leberstoffwechsels (MASLD) z

arXiv – cs.AI Original
Anzeige