GRAFT: Neues multimodales Benchmark für visuelle und textuelle Analyse
Die neueste Veröffentlichung auf arXiv, GRAFT, stellt ein strukturiertes multimodales Benchmark dar, das Modelle auf ihre Fähigkeit zur Befolgung von Anweisungen, visuellem Denken und der Ausrichtung von Bild- und Texti…