<iLTM: Das neue All-in-One-Modell für Tabellendaten</iLTM>

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Tabellendaten bilden die Grundlage für Entscheidungen in Wissenschaft, Industrie und öffentlicher Verwaltung. Trotz großer Fortschritte im Deep Learning bleiben Gradient-Boosted Decision Trees (GBDTs) in der Praxis die bevorzugte Wahl. Das neue Modell iLTM (Integrated Large Tabular Model) soll diese Lücke schließen, indem es Baumbasierte Einbettungen, dimensionsunabhängige Repräsentationen, ein hypernetzwerk, mehrschichtige Perzeptronen und Retrieval in einer einzigen Architektur vereint.

iLTM wurde auf über 1.800 heterogenen Klassifikationsdatensätzen vortrainiert und zeigt konsequent bessere Ergebnisse bei tabellarischen Klassifikations- und Regressionsaufgaben – von kleinen Datensätzen bis hin zu großen, hochdimensionalen Problemen. Nach einer leichten Feinabstimmung überträgt das hypernetzwerk die erlernten Fähigkeiten auf Regressionsziele und übertrifft dabei starke Baselines.

Umfangreiche Experimente belegen, dass iLTM sowohl GBDTs als auch führende Deep-Tabular-Modelle übertrifft, während es weniger aufgaben-spezifische Anpassungen erfordert. Durch die Kombination von baumbasierten und neuronalen Ansätzen bietet iLTM ein neues Fundament für robuste, anpassungsfähige und skalierbare Tabellendatenmodelle.

Ähnliche Artikel