Intelligenz braucht Grounding, nicht Embodiment
Die jüngsten Fortschritte bei großen Sprachmodellen (LLMs) haben die wissenschaftliche Debatte darüber neu entfacht, ob ein Körper für echte Intelligenz unverzichtbar ist. Forscher argumentieren nun, dass es nicht das körperliche Vorhandensein selbst ist, sondern die Fähigkeit, Informationen in einem konkreten Kontext zu verankern – das sogenannte Grounding – die entscheidende Voraussetzung für Intelligenz darstellt.
Intelligenz wird hier definiert als die Kombination aus Motivation, Vorhersagefähigkeit, Kausalverständnis und dem Lernen aus Erfahrung. Diese vier Eigenschaften lassen sich laut der Studie vollständig durch einen nicht-embodierten, aber dennoch grounded Agenten realisieren. Ein solcher Agent kann beispielsweise durch Interaktion mit einer digitalen Umgebung seine Motivationen entwickeln, Muster vorhersagen, kausale Zusammenhänge erkennen und aus den gesammelten Daten lernen, ohne einen physischen Körper zu besitzen.
Aus dieser Analyse folgt die zentrale These: Grounding ist die notwendige Bedingung für Intelligenz, Embodiment hingegen nicht. Das bedeutet, dass ein Agent, der seine Wahrnehmungen und Handlungen konsequent mit einer sinnlichen oder digitalen Welt verknüpft, intelligent handeln kann, selbst wenn er keinen physischen Körper hat.
Um die Argumentation zu veranschaulichen, wird ein Gedankenexperiment vorgestellt: Ein LLM-Agent operiert in einer vollständig virtuellen Umgebung, in der er Objekte manipulieren, Ziele verfolgen und aus den Konsequenzen seiner Handlungen lernen kann. Durch diese digitale Grounding‑Interaktion demonstriert der Agent die vier definierten Intelligenzmerkmale, ohne jemals einen physischen Körper zu besitzen.
Potenzielle Gegenargumente, die Embodiment als unverzichtbar ansehen, werden ebenfalls adressiert. Die Autoren zeigen, dass die meisten Einwände auf einer unvollständigen Definition von Intelligenz beruhen und dass die Fähigkeit, in einer konkreten Umgebung zu handeln und zu lernen, bereits ohne physischen Körper ausreicht, um die klassischen Merkmale intelligenter Systeme zu erfüllen.