Neuer Ansatz: Text2Weight verbindet Sprache mit neuronalen Gewichten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Forscher haben einen innovativen Ansatz vorgestellt, der es ermöglicht, neuronale Netzwerkgewichte direkt aus natürlichen Sprachbeschreibungen zu generieren. Das neue System, genannt T2W, nutzt einen Diffusions-Transformer, um Aufgaben-spezifische Gewichte zu erzeugen, die exakt den Anforderungen der jeweiligen Aufgabe entsprechen.

Derzeitige Methoden zur automatischen Gewichtsgenerierung stoßen häufig an Grenzen: Sie generalisieren schlecht auf unbekannte Aufgaben und lassen sich nur schwer in der Praxis einsetzen. T2W adressiert diese Probleme, indem es die Netzwerkparameter hierarchisch in einheitliche Blöcke zerlegt und Text-Embeddings aus CLIP mittels eines Prior-Attention-Mechanismus integriert.

Durch adversariales Training kombiniert mit Gewichtsspace-Augmentation wird die Generalisierungsfähigkeit weiter verbessert. In Experimenten auf Cifar100, Caltech256 und TinyImageNet konnte T2W hochwertige Gewichte für bisher nicht gesehene Aufgaben erzeugen und übertraf dabei herkömmliche Optimierungs-basierte Initialisierungsmethoden.

Die Arbeit schafft eine Brücke zwischen sprachlicher Semantik und der Dynamik des Gewichtespektrums. Ein öffentlich zugängliches Datenset aus Text-Gewicht-Paaren sowie der zugehörige Code stehen auf GitHub bereit, was die praktische Anwendung generativer Modelle in der Parameter‑Synthese deutlich vorantreibt.