Logit-basierte Unsicherheitsmessung verbessert Vertrauen in VLMs für Histopathologie
Vision‑Language‑Modelle (VLMs) haben in nahezu allen Bereichen – von Bildung über Transport bis hin zu Gesundheit – beeindruckende Erfolge erzielt. In der Medizin stellen sie jedoch besondere Herausforderungen dar, denn die Sensibilität medizinischer Daten und die Vertrauenswürdigkeit der Modelle sind entscheidend.
In einer neuen Studie wird ein Logit‑Level‑Uncertainty‑Quantification‑Framework vorgestellt, das speziell für die Analyse von Histopathologie‑Bildern mit VLMs entwickelt wurde. Durch die Kontrolle der Temperatur in den Logit‑Ausgaben lassen sich Unsicherheitsmaße wie Cosinus‑Ähnlichkeit, Jensen‑Shannon‑Divergenz und Kullback‑Leibler‑Divergenz exakt bestimmen.
Die Untersuchung umfasst drei VLMs. Diese Modelle zeigen eine hohe stochastische Sensitivität (Cosinus‑Ähnlichkeit unter 0,71 bzw. 0,84, Jensen‑Shannon‑Divergenz unter 0,57 bzw. 0,38, Kullback‑Leibler‑Divergenz unter 0,55 bzw. 0,35) und reagieren stark auf Temperaturänderungen (ΔT ≈ 1,00). Besonders bei komplexen diagnostischen Anfragen treten abrupte Unsicherheitswechsel auf.
Im Gegensatz dazu bleibt das pathologie‑spezifische PRISM‑Modell nahezu deterministisch (Cosinus‑Ähnlichkeit > 0,90, Jensen‑Shannon‑Divergenz < 0,10, Kullback‑Leibler‑Divergenz < 0,09) und ist kaum von Temperaturänderungen betroffen. Diese Ergebnisse unterstreichen, wie wichtig die Logit‑Level‑Unsicherheitsmessung ist, um die Zuverlässigkeit von VLMs in der Histopathologie zu bewerten.