Neue Task‑Matrizen ermöglichen effizientes Finetuning von Vision‑ und Sprachmodellen
Wissenschaftler haben ein neues Verfahren namens Task‑Matrix vorgestellt, das die Feinabstimmung großer Vision‑ und Sprachmodelle deutlich beschleunigt. Die Methode nutzt eine lineare Transformation, die den Zustand eines vortrainierten Modells in den Zustand eines finetuneten Modells überführt.
In umfangreichen Tests mit zehn unterschiedlichen Datensätzen zeigte sich, dass ein Basismodell, das mit einer Task‑Matrix ergänzt wird, die Leistung linearer Probes übertrifft und in vielen Fällen sogar die Ergebnisse eines vollständigen Finetunings erreicht. Damit wird die Existenz von linearen Encodings zwischen vortrainierten und finetuneten Architekturen bestätigt.
Ein weiterer Vorteil der Task‑Matrix ist ihre datenbasierte Approximation, die nicht nur effizient, sondern auch in verschiedenen Domänen generalisierbar ist. Die Entwickler haben die Implementierung öffentlich zugänglich gemacht, sodass Forscher und Praktiker die Technik sofort in eigenen Projekten einsetzen können.