Forschung
Generalisierung von multimodalen LLMs bei einfachen visuellen Planungsaufgaben
In den letzten Monaten hat die Integration von Begründungsmechanismen in große Sprachmodelle und Vision‑Language‑Modelle die Leistungsfähig…
arXiv – cs.LG