Video-Generierung als Schlüssel zur visuellen Logik: Zero-Shot-Genauigkeit
Ein neues arXiv‑Veröffentlichung (2601.21037v1) zeigt, dass Video‑Generierungsmodelle die Grenzen der visuellen Logik sprengen können. Während klassische Vision‑Language‑Modelle bei textbasierten Aufgaben glänzen, kämpf…