Discrete Transformer: Algorithmen aus Modellen extrahieren – neue Interpretierbarkeit
Ein neues Verfahren namens Discrete Transformer eröffnet die Möglichkeit, aus trainierten Modellen eigenständig ausführbare Programme zu generieren. Durch die gezielte Trennung von numerischer Aufmerksamkeit und elementweiser Arithmetik wird die bisherige Schwierigkeit der Superposition – bei der sich Informationen in überlappenden Richtungen vermischen – überwunden. Das Ergebnis ist ein Modell, das nicht nur die Leistung traditioneller RNN-basierter Ansätze erreicht, sondern gleichzeitig die Interpretierbarkeit in kontinuierlichen Variablenbereichen deutlich verbessert.