MLLMs erkennen Symbole nicht: Kognitive Diskrepanz bei multimodalen Sprachmodellen
Multimodale Large Language Models (MLLMs) haben in der Bild‑ und Textinterpretation enorme Fortschritte erzielt, doch ihre Fähigkeit, diskrete Symbole – die Bausteine menschlichen Denkens – zu verarbeiten, bleibt fragli…