<h1>MLLMs mit Bild-Tools: Ophiuchus verbessert medizinische Bildanalyse</h1> <p>In der medizinischen Bildanalyse haben sich multimodale Large Language Models (MLLMs) bereits durch die Fähigkeit, schrittweise textuelle Argumentationsketten zu erzeugen, hervorgetan. Dennoch bleiben komplexe Aufgaben, die ein dynamisches und iteratives Fokussieren auf feine Bildregionen erfordern, eine Herausforderung. Mit dem neuen Framework <strong>Ophiuchus</strong> wird dieses Problem angegangen.</p> <p>Ophiuchus erweitert

arXiv – cs.AI Original
Anzeige