AGDC: Modell für diskrete & kontinuierliche Sequenzen – hochpräzise Generierung

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Ein neues Forschungsprojekt namens AGDC (Autoregressive Generierung von variablen Sequenzen mit gemeinsamen diskreten und kontinuierlichen Räumen) hat die Grenzen herkömmlicher Transformer‑Modelle sprengt. Während klassische autoregressive Modelle auf diskrete Token angewiesen sind, die die Darstellung kontinuierlicher Werte stark einschränken, kombiniert AGDC die Vorhersage diskreter Werte mit einem diffusion‑basierten Ansatz für kontinuierliche Werte. Dadurch kann das Modell hochpräzise, variable Sequenzen erzeugen – ein entscheidender Fortschritt für Anwendungen wie die Gestaltung von Halbleiter‑Schaltkreisen, wo selbst kleinste Ungenauigkeiten zu Fehlfunktionen führen können.

AGDC nutzt zwei zentrale technische Neuerungen: Erstens ein End‑of‑Sequence‑Logit‑Anpassungssystem, das mithilfe eines MLP die EOS‑Token‑Logits dynamisch an den Kontext der Sequenz anpasst; zweitens eine Längen‑Regularisierung, die in die Verlustfunktion integriert ist und die Modellierung variabler Längen stabilisiert. Diese Kombination ermöglicht eine nahtlose Integration diskreter und kontinuierlicher Elemente in einer einzigen, skalierbaren Architektur.

Zur Bewertung des Ansatzes wurde ContLayNet – ein umfangreiches Benchmark‑Set mit 334 000 hochpräzisen Halbleiter‑Layout‑Proben – entwickelt. ContLayNet bietet spezialisierte Metriken, die die funktionale Korrektheit messen, da hier Präzisionsfehler erhebliche Auswirkungen haben. AGDC wurde nicht nur auf diesem Set, sondern auch auf grafischen Layouts und SVG‑Daten getestet. In allen Fällen übertraf das Modell die bisherigen diskretisierungsbasierten und festen Schema‑Baselines deutlich und zeigte eine skalierbare, hochpräzise Generierung von hybriden Vektor‑Repräsentationen.

Ähnliche Artikel