LLMs zeigen starkes abstraktes visuelles Denken – Benchmark auf RAVEN-FAIR
In einer systematischen Untersuchung wurden vier große Sprachmodelle – GPT‑4.1‑Mini, Claude‑3.5‑Haiku, Gemini‑1.5‑Flash und Llama‑3.3‑70b – auf ihre Fähigkeiten im abstrakten visuellen Denken getestet. Dabei kamen vier unterschiedliche Architekturen zum Einsatz: Single‑Shot, embedding‑controlled Repetition, Self‑Reflection und Multi‑Agent.