Neuer First-Order-Layer vereinfacht differenzierbare Optimierung

arXiv – cs.LG • 03.12.2025 05:00 • Original • ≈1 Min. Lesezeit

In der Welt der lernenden Systeme ermöglichen differenzierbare Optimierungslayer, Entscheidungen zu treffen, indem sie eingebettete Optimierungsprobleme lösen. Traditionell erfordert die Berechnung der Gradienten über implizite Differenzierung die Lösung linearer Gleichungssysteme mit Hessian-Terms – ein Ansatz, der sowohl rechenintensiv als auch speicherhungrig ist.

Die neue Methode, die im Preprint arXiv:2512.02494v1 vorgestellt wird, nutzt ausschließlich First‑Order‑Informationen. Durch die Umformulierung des Problems als Bilevel‑Optimierung und die Einführung eines aktiven Set‑Lagrange‑Hypergradient‑Orakels werden Hessian‑Berechnungen vollständig vermieden. Das Ergebnis ist ein Verfahren, das in konstanter Zeit (∼O(1)) einen approximativen Hypergradienten liefert und damit die Gesamtkosten auf ∼O(δ⁻¹ε⁻³) reduziert – ein Tempo, das mit den besten bekannten Raten für nicht‑glatte, nicht‑konvexe Optimierung übereinstimmt.

Die Autoren stellen zudem eine Open‑Source‑Python‑Bibliothek zur Verfügung, die sich leicht an bestehende Solver anpassen lässt. Der Code ist unter GitHub verfügbar und bietet Forschern und Entwicklern ein praktisches Werkzeug, um die Vorteile dieses First‑Order‑Layers in eigenen Projekten zu nutzen.

Ähnliche Artikel

🍪 Cookie-Einstellungen