Modell-Merging ermöglicht effiziente Optimierung multimodaler Datemischungen
In der Welt der multimodalen großen Sprachmodelle ist die Auswahl der optimalen Datenmischung entscheidend für den Erfolg des Supervised Fine‑Tuning (SFT). Doch die Suche nach den besten Mischungsgewichten über mehrere…