Neues Token-Konzept verbessert räumliches Denken in multimodalen Modellen
Eine aktuelle Veröffentlichung auf arXiv präsentiert ein innovatives Verfahren, mit dem multimodale Sprachmodelle ihre bisherige egocentrische Verzerrung bei räumlichen Aufgaben überwinden können. Durch die Einführung v…