Neuer Ansatz: Text2Weight verbindet Sprache mit neuronalen Gewichten
Forscher haben einen innovativen Ansatz vorgestellt, der es ermöglicht, neuronale Netzwerkgewichte direkt aus natürlichen Sprachbeschreibungen zu generieren. Das neue System, genannt T2W, nutzt einen Diffusions-Transformer, um Aufgaben-spezifische Gewichte zu erzeugen, die exakt den Anforderungen der jeweiligen Aufgabe entsprechen.
Derzeitige Methoden zur automatischen Gewichtsgenerierung stoßen häufig an Grenzen: Sie generalisieren schlecht auf unbekannte Aufgaben und lassen sich nur schwer in der Praxis einsetzen. T2W adressiert diese Probleme, indem es die Netzwerkparameter hierarchisch in einheitliche Blöcke zerlegt und Text-Embeddings aus CLIP mittels eines Prior-Attention-Mechanismus integriert.
Durch adversariales Training kombiniert mit Gewichtsspace-Augmentation wird die Generalisierungsfähigkeit weiter verbessert. In Experimenten auf Cifar100, Caltech256 und TinyImageNet konnte T2W hochwertige Gewichte für bisher nicht gesehene Aufgaben erzeugen und übertraf dabei herkömmliche Optimierungs-basierte Initialisierungsmethoden.
Die Arbeit schafft eine Brücke zwischen sprachlicher Semantik und der Dynamik des Gewichtespektrums. Ein öffentlich zugängliches Datenset aus Text-Gewicht-Paaren sowie der zugehörige Code stehen auf GitHub bereit, was die praktische Anwendung generativer Modelle in der Parameter‑Synthese deutlich vorantreibt.