Neuer Ansatz: KI lernt, optimale visuelle Demonstrationen auszuwählen
Multimodale große Sprachmodelle (MLLMs) nutzen In‑Context‑Learning (ICL), um visuelle Aufgaben zu lösen. Dabei spielt die Qualität der Demonstrationen eine entscheidende Rolle. Der bisher vorherrschende Ansatz, k‑Neares…