TRACE: Framework zur Analyse schrittweiser Logik in Vision‑Language‑Modellen
Die Fähigkeit großer Vision‑Language‑Modelle, mathematische und wissenschaftliche Probleme zuverlässig zu lösen, ist nach wie vor ein offenes Problem. Traditionelle Prüfungen, die nur das Endergebnis bewerten, verbergen häufig Fehler in den Zwischenschritten und lassen stille Ausfälle unbemerkt.