Optimierung der Datenmischung für Fine‑Tuning großer Sprachmodelle
Ein neues Verfahren zur Optimierung der Datenmischung für das supervised Fine‑Tuning großer Sprachmodelle wurde vorgestellt. Die Autoren stellen die Datenmischung als ein Optimierungsproblem dar und entwickeln einen Ans…