AgentsEval: Mehr Transparenz bei der Bewertung medizinischer Bildberichterstattung
Die Bewertung der klinischen Richtigkeit und der logischen Kohärenz von automatisch generierten medizinischen Bildberichten ist ein zentrales, bislang ungelöstes Problem. Traditionelle Methoden erfassen oft nicht die strukturierten diagnostischen Überlegungen, die Radiologen bei ihrer Interpretation nutzen, was zu unzuverlässigen und klinisch wenig relevanten Urteilen führt.