UNDO Flip-Flop: Neue Aufgabe zeigt Grenzen von SSMs bei reversiblen Zuständen
State‑Space‑Modelle (SSMs) gelten als theoretisch fähig, sowohl star‑freie sequentielle Aufgaben als auch begrenzte hierarchische Strukturen zu modellieren. In der Praxis bleibt jedoch unklar, ob gradientbasierte Optimi…
- State‑Space‑Modelle (SSMs) gelten als theoretisch fähig, sowohl star‑freie sequentielle Aufgaben als auch begrenzte hierarchische Strukturen zu modellieren.
- In der Praxis bleibt jedoch unklar, ob gradientbasierte Optimierung tatsächlich die dafür notwendigen Lösungen findet.
- Um diese Lücke zu schließen, wurde die UNDO Flip‑Flop‑Aufgabe entwickelt.
State‑Space‑Modelle (SSMs) gelten als theoretisch fähig, sowohl star‑freie sequentielle Aufgaben als auch begrenzte hierarchische Strukturen zu modellieren. In der Praxis bleibt jedoch unklar, ob gradientbasierte Optimierung tatsächlich die dafür notwendigen Lösungen findet.
Um diese Lücke zu schließen, wurde die UNDO Flip‑Flop‑Aufgabe entwickelt. Sie erweitert das klassische Flip‑Flop‑Problem um eine UNDO‑Funktion, die ein Modell dazu zwingt, einen impliziten, begrenzten Stapel zu führen und historische Zustände bei nicht‑monotonen Updates wiederherzustellen.
Bei der Evaluation mit ein‑ und zweischichtigen Mamba‑2‑Modellen zeigte sich, dass beide Varianten das theoretisch mögliche Stapel‑Rollback‑Verfahren nicht erlernen. Stattdessen entwickelten sie eine lokale Umschaltheuristik, die lediglich den aktuellen Zustand invertiert. Unter einem adversarialen Rückzugs‑Test erreichte das zweischichtige Modell lediglich 41,10 % Genauigkeit – deutlich unter Zufallsniveau – was auf ein systematisches Versagen hinweist.
Eine kausale Ablation ergab, dass das Problem nicht im Speichern, sondern im Abrufen der gespeicherten Zustände liegt. Diese Ergebnisse verdeutlichen klar den Unterschied zwischen dem, was eine Architektur prinzipiell darstellen kann, und dem, was Gradient‑Descent tatsächlich lernt – ein Unterschied, den reine theoretische Expressivitätsanalysen nicht erfassen können.
Welche Linse du auf diese Meldung legen solltest
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.
Kontext ohne Glossar-Suche
Wenn du nach dieser Meldung weiterlernen willst
Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen
Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.
Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.
Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.
Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.