SITA: Automatisierte Formalisierung von Struktur-zu-Instanz-Theoremen
Die jüngste Veröffentlichung von SITA (Structure-to-Instance Theorem Autoformalization) zeigt, wie große Sprachmodelle (LLMs) die Lücke zwischen abstrakten mathematischen Theorien und konkreten Anwendungen in der Lean-Proof-Assistant-Umgebung schließen können. Trotz bemerkenswerter Fortschritte in der mathematischen Argumentation stoßen LLMs noch immer an Grenzen, wenn es darum geht, Theoreme, die aus abstrakten Strukturen abgeleitet werden, automatisch zu formalisierten Beweisen zu überführen.
Das SITA-Framework nutzt modulare Vorlagen, die Definitionen, Annahmen, Operationen und Theoreme enthalten. Diese Vorlagen fungieren als wiederverwendbare Leitfäden, die die Formalisierung konkreter Instanzen erleichtern. Sobald eine spezifische Instanz definiert ist, generiert SITA die entsprechenden Lean-Definitionen und Instanzdeklarationen, integriert sie mithilfe des Typeclass-Mechanismus von Lean und baut verifizierte Theoreme auf Basis der strukturellen Voraussetzungen auf.
Ein zentrales Merkmal von SITA ist die Kombination von LLM-basierter Generierung mit einem feedbackgesteuerten Verfeinerungsprozess. Dieser Ansatz gewährleistet sowohl eine hohe Automatisierung als auch die formale Korrektheit der erzeugten Beweise, indem Fehler frühzeitig erkannt und korrigiert werden.
Durch Experimente mit einer Sammlung von Optimierungsproblemen konnte gezeigt werden, dass SITA in der Lage ist, vielfältige Instanzen, die auf abstrakten Strukturen beruhen, erfolgreich zu formalisierten Lean-Beweisen zu überführen. Die Ergebnisse deuten darauf hin, dass SITA einen bedeutenden Schritt in Richtung automatisierter, forschungsreifer Formalisierung mathematischer Resultate darstellt.