PRISM: EEG‑Model mit globaler Vielfalt übertrifft herkömmliche Ansätze

Die neueste Veröffentlichung auf arXiv (2603.02268v1) stellt PRISM vor – ein EEG‑Foundation‑Model, das die bisherige Praxis, Modelle ausschließlich auf engen, europäischen und US‑Datensätzen zu trainieren, hinterfragt. Durch die Kombination eines maskierten Autoencoders mit einer festen Architektur und einer einheitlichen Vorverarbeitung untersucht PRISM, ob die erlernten Repräsentationen wirklich die neuronale Physiologie widerspiegeln oder lediglich artefaktbasierte Muster aus dem Trainingsdatensatz übernehmen.

PRISM wird in zwei Varianten trainiert: einmal mit einem traditionellen EU/US‑Korpus (TUH + PhysioNet) und einmal mit einem geografisch vielfältigen Pool, der multi‑zentrierte Aufnahmen aus Südasien über verschiedene EEG‑Systeme hinweg umfasst. Diese Gegenüberstellung ermöglicht es, die Auswirkungen der Trainingspopulation auf die Modellleistung systematisch zu analysieren.

Die Ergebnisse zeigen einen klaren Kompromiss: Modelle, die auf engen Quellen vortrainiert wurden, erzielen stärkere lineare Probes auf Benchmarks, die dieselbe Verteilung haben, während die diversifizierten Modelle unter Feinabstimmung deutlich flexibler sind. PRISM erreicht oder übertrifft sogar die Leistungen von REVE – einem Modell, das auf über 60.000 Stunden aus 92 Datensätzen basiert – und demonstriert damit, dass gezielte Vielfalt den Vorteil von unkontrolliertem Skalieren ersetzen kann. Gleichzeitig wird deutlich, dass die reine Anzahl der Datensätze ein starkes Verzerrungsmerkmal in Modellvergleichen darstellt.

Besonders beeindruckend ist die klinische Anwendung: Bei der schwierigen Aufgabe, Epilepsie von diagnostischen Mimics anhand interiktaler EEG‑Signale zu unterscheiden, liegt der Unterschied zwischen dem diversifizierten und dem engen Modell bei 12,3 Prozentpunkten in der balancierten Genauigkeit – der größte Abstand aller getesteten Szenarien. Darüber hinaus zeigen systematische Inkonsistenzen zwischen den Benchmarks EEG‑Bench und EEG‑FM‑Bench, dass Modellrankings je nach Testumgebung umgekehrt werden können, was die Notwendigkeit robuster, vielfältiger Trainingsdaten unterstreicht.

🍪 Cookie-Einstellungen