KI und Mensch: Gemeinsamkeiten und Unterschiede bei der Bildklassifizierung

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

In einer neuen Studie aus dem arXiv-Repository wird untersucht, wie Menschen und moderne KI-Modelle unscharfe, niedrigauflösende Bilder interpretieren. Durch den Vergleich von menschlichen Bildbeschriftungen mit den Ergebnissen tiefen neuronaler Netzwerke liefert die Arbeit wertvolle Einblicke in Wahrnehmung, Entscheidungsfindung und kognitive Strategien.

Die Forscher nutzen Konzepte aus der kognitiven Wissenschaft, wie die drei Ebenen von Marr, die begrenzte Rationalität von Simon und Thagards emotionale Repräsentationsmodelle, um die Unterschiede und Gemeinsamkeiten zwischen biologischen und künstlichen Systemen zu beleuchten. Dabei werden menschliche Ansätze wie analogisches Denken, Formwahrnehmung und Vertrauensmodulation mit der feature‑basierten Verarbeitung von KI verglichen.

Ein besonderes Augenmerk liegt auf der Analyse von Grad‑CAM‑Visualisierungen, die zeigen, wo die Modelle ihre Aufmerksamkeit fokussieren. Parallel dazu werden die menschlichen Antworten mit kognitiven Architekturen wie ACT‑R und Soar modelliert, um die mehrschichtigen, heuristischen Entscheidungswege unter Unsicherheit zu erklären.

Die Ergebnisse unterstreichen sowohl Parallelen als auch signifikante Unterschiede in Repräsentation, Inferenz und Vertrauenskalibrierung. Sie legen die Grundlage für zukünftige neuro‑symbolische Architekturen, die strukturiertes symbolisches Denken mit konnektionistischen Darstellungen verbinden. Solche Systeme versprechen nicht nur hohe Leistungsfähigkeit, sondern auch Erklärbarkeit und eine starke kognitive Ausrichtung.

Ähnliche Artikel