Bidirektionale LSTM‑Netzwerke klassifizieren Lichtkurven transienter Himmelsobjekte
In einer aktuellen Studie wurde ein bidirektionales Long Short‑Term Memory (LSTM) Netzwerk entwickelt, das Lichtkurven von transienten Himmelsobjekten aus dem PLAsTiCC‑Datensatz klassifiziert. Die ursprünglich vierzehn Klassen wurden zu fünf übergeordneten Kategorien – S‑Like, Fast, Long, Periodic und Non‑Periodic – zusammengefasst, um das Problem der Klassenungleichgewichte zu mildern. Nach einer sorgfältigen Vorverarbeitung, die Padding, zeitliche Skalierung und Flux‑Normalisierung beinhaltete, wurde das Modell mit Maskierungsschichten trainiert und auf 19 920 Testobjekten evaluiert.
Das Netzwerk erzielte beeindruckende Ergebnisse für die S‑Like‑ und Periodic‑Kategorien, mit ROC‑AUC‑Werten von 0,95 bzw. 0,99 und Precision‑Recall‑AUC‑Werten von 0,98 und 0,89. Für die Fast‑ und Long‑Klassen war die Leistung deutlich geringer – die Long‑Klasse erreichte nur einen ROC‑AUC von 0,68. Zudem zeigte das Modell Schwierigkeiten, Periodic‑ und Non‑Periodic‑Objekte zuverlässig zu unterscheiden.
Eine weitere Analyse mit partiellen Lichtkurven (5, 10 und 20 Tage nach der Detektion) offenbarte einen deutlichen Leistungsabfall, wobei die Fehlklassifikationen zunehmend in die S‑Like‑Kategorie verschoben wurden. Diese Ergebnisse deuten darauf hin, dass die Hauptbeschränkungen durch Klassenungleichgewichte und begrenzte zeitliche Informationen entstehen. Der Einsatz von Balancierungsstrategien und gezielteren Vorverarbeitungsschritten, die sich auf die Detektionsmomente konzentrieren, könnte die Klassifikationsgenauigkeit erheblich verbessern.