jBOT: Selbstdistillation erzeugt semantische Jet‑Clustering

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Die neue Methode jBOT nutzt Selbstdistillation, um aus den Jet‑Daten des CERN Large Hadron Collider ohne Labels aussagekräftige Merkmalsdarstellungen zu lernen. Durch die Kombination von partikel‑ und jet‑level Distillation werden lokale und globale Strukturen gleichzeitig erfasst.

Das Ergebnis ist ein semantisches Clustering der Jet‑Klassen im Repräsentationsraum. Bereits bei einer Vortrainierung ausschließlich mit Hintergrund‑Jets entsteht eine klare Gruppierung, die Anomalien durch einfache Distanzmetriken erkennen lässt.

Die daraus abgeleitete Embedding‑Schicht kann anschließend feinjustiert werden, um Klassifikationsaufgaben zu lösen. In Tests übertrifft sie die Leistung von von Grund auf trainierten überwachten Modellen und bietet damit einen deutlichen Vorteil für nachgelagerte Analysen.

jBOT markiert einen wichtigen Schritt in der datengetriebenen Teilchenphysik, indem es die Analyse von Jet‑Daten effizienter und weniger von manuellen Labels abhängig macht. Die Methode eröffnet neue Möglichkeiten für die Erkennung seltener Phänomene und die Optimierung von Klassifikationsalgorithmen.

Ähnliche Artikel