SmallML: Bayesian Transfer Learning macht KI für kleine Unternehmen möglich
Fast alle US-Unternehmen – 99,9 % der Firmen – sind kleine und mittlere Unternehmen (KMU). Trotz ihrer Größe bleiben sie systematisch von modernen KI‑Lösungen ausgeschlossen, weil die meisten Algorithmen große Datenmengen benötigen, die KMU nicht besitzen. Das neue Framework SmallML löst dieses Problem, indem es Bayesian Transfer Learning nutzt und mit nur 50 bis 200 Beobachtungen Unternehmens‑level‑Präzision liefert.
SmallML besteht aus drei Schichten. In der ersten Schicht werden informative Prior‑Werte aus 22 673 öffentlichen Datensätzen extrahiert. Dabei wird ein SHAP‑basierter Ansatz verwendet, um Wissen von Gradient‑Boosting‑Modellen auf logistische Regressionen zu übertragen. Die zweite Schicht führt hierarchisches Pooling über 5 bis 50 KMU durch und nutzt adaptives Shrinkage, um Populationsmuster mit firmenspezifischen Eigenschaften zu balancieren. In der dritten Schicht werden konforme Vorhersagesätze erzeugt, die eine endliche Stichprobendeckung garantieren: P(y ∈ C(x)) ≥ 1 – α, ohne Annahmen über die zugrunde liegende Verteilung.
Die Validierung auf Kundenaustrittsdaten zeigte beeindruckende Ergebnisse: Mit nur 100 Beobachtungen pro Unternehmen erreichte SmallML einen AUC‑Wert von 96,7 % ± 4,2 %. Das ist eine Verbesserung um 24,2 Punkte gegenüber einer unabhängigen logistischen Regression (72,5 % ± 8,1 %) und statistisch hochsignifikant (p < 0,000001). Die konforme Vorhersage erzielte zudem 92 % empirische Abdeckung bei einem Ziel von 90 %.
Das Training dauert lediglich 33 Minuten auf Standard‑CPU‑Hardware, was die Skalierbarkeit für den breiten Einsatz in der Praxis unterstreicht. Durch SmallML können rund 33 Millionen US‑KMU nun KI‑gestützte Vorhersagen nutzen, die zuvor aufgrund fehlender Daten unmöglich waren. Damit schließt das System eine entscheidende Lücke in der Demokratisierung von künstlicher Intelligenz.