Fine‑Tuning: Sprachmodelle werden sensorisch präziser
Large Language Models (LLMs) zeigen ein deutliches „Embodiment‑Gap“, denn ihre textbasierten Repräsentationen stimmen nicht mit menschlichen sensorisch-motorischen Erfahrungen überein. In einer neuen Untersuchung aus dem arXiv‑Repository (2603.03313v1) wird systematisch geprüft, ob und wie task‑spezifisches Fine‑Tuning dieses Missverhältnis schließen kann.
Die Forscher nutzen Representational Similarity Analysis (RSA) sowie dimensionspezifische Korrelationsmetriken, um die inneren Zustände der Modelle zu analysieren. Die Ergebnisse zeigen, dass gezieltes Fine‑Tuning die internen Repräsentationen stärker an embodied, grounded Mustern ausrichten kann.
Besonders erfreulich ist, dass die sensorisch‑motorischen Verbesserungen robust über verschiedene Sprachen hinweg und in verwandten sensorisch‑motorischen Dimensionen generalisieren. Gleichzeitig bleibt die Wirkung stark abhängig vom Lernziel: Ein Modell, das für eine bestimmte Aufgabe optimiert wurde, überträgt seine sensorische Präzision nicht automatisch auf ein völlig anderes Aufgabenformat.
Die Studie unterstreicht damit die Kraft von Fine‑Tuning, LLMs näher an menschliche Wahrnehmung zu bringen – solange die Lernziele sorgfältig gewählt werden.