BlockCert: Zertifizierte Blockweise Extraktion von Transformer-Mechanismen
Die neueste Veröffentlichung auf arXiv (2511.17645v1) stellt BlockCert vor – ein Framework, das es ermöglicht, einzelne Residualblöcke von vortrainierten Transformer‑Modellen exakt zu extrahieren und gleichzeitig Zertifikate zu liefern, die die Approximationstoleranz begrenzen. Durch die Kombination von strukturierten Surrogatimplementierungen mit maschinell prüfbaren Zertifikaten erhält man einen klaren Überblick darüber, wie nah die extrahierten Blöcke an den Originalfunktionen liegen.