SRNN: Neuronales Netzwerk erfasst intuitive Physik mit Gehirn‑inspirierter Logik

arXiv – cs.AI Original ≈1 Min. Lesezeit
Anzeige

Ein neues Modell namens Spatiotemporal Relational Neural Network (SRNN) verspricht, die bislang unübertroffene menschliche Intuition in der Physik für Maschinen nachzubilden. Durch die Kombination von objektbezogenen Merkmalen, Beziehungen und zeitlichen Abläufen in einer einzigen neuronalen Repräsentation setzt SRNN einen bedeutenden Schritt in Richtung einer biologisch inspirierten künstlichen Intelligenz.

Die Architektur nutzt einen Hebb‑basierten Lernmechanismus, der das Prinzip „Fire Together, Wire Together“ in zwei spezialisierten Pfaden – dem „What“- und dem „How“-Pfad – implementiert. Diese Pfade verarbeiten gleichzeitig die Identität von Objekten und ihre dynamischen Wechselwirkungen, sodass das Netzwerk ein kohärentes Bild der Szene erzeugt.

Ein besonderes Merkmal von SRNN ist die Fähigkeit, aus dieser einheitlichen Repräsentation strukturierte sprachliche Beschreibungen zu generieren. Damit wird die Kluft zwischen visueller Wahrnehmung und natürlicher Sprache überbrückt und ein gemeinsamer neuronaler Substrat geschaffen, das sowohl Bild- als auch Textdaten verarbeitet.

Im Gegensatz zum üblichen „pretrain‑then‑finetune“-Ansatz verfolgt SRNN einen „predefine‑then‑finetune“-Pfad, der die Modellarchitektur von vornherein festlegt und anschließend feinjustiert. Auf dem CLEVRER‑Benchmark erzielt das Netzwerk konkurrenzfähige Ergebnisse. Darüber hinaus zeigt die Analyse eine systematische Verzerrung des Benchmarks auf, schlägt Wege zu einer ganzheitlicheren Bewertung vor und demonstriert die White‑Box‑Fähigkeit von SRNN für präzise Fehlerdiagnosen. Insgesamt unterstreicht die Arbeit die Machbarkeit, biologische Intelligenzprinzipien in technische Systeme zu übertragen, um intuitive Physik zu verstehen.

Ähnliche Artikel