VisualScratchpad: Visuale Konzepte in Vision‑Language‑Modellen analysieren
Vision‑Language‑Modelle liefern zwar beeindruckende Ergebnisse, doch liefern sie häufig falsche Antworten. Die Gründe dafür sind oft schwer nachvollziehbar, weil die internen Abläufe der Modelle nicht transparent sind…