Robuste Schätzung bei heterogenen Korruptionsraten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Eine neue Veröffentlichung auf arXiv präsentiert ein umfassendes Ergebnis zur robusten Schätzung, wenn einzelne Stichproben mit unterschiedlichen, bekannten Wahrscheinlichkeiten verfälscht werden können. Dieses Szenario tritt häufig in verteilten und föderierten Lernsystemen, bei Crowdsourcing‑Plattformen sowie in Sensor­netzen auf.

Derzeit gehen die meisten robusten Schätzer von einer einheitlichen oder vom schlimmsten Fall ausgeprägten Korruption aus und vernachlässigen damit die strukturelle Heterogenität der Daten. Die vorgestellte Arbeit schließt diese Lücke und liefert für die Mittelwertschätzung bei mehrdimensionalen, beschränkten Verteilungen sowie bei ein‑dimensionalen Gaußverteilungen exakt minimax‑Raten für sämtliche heterogene Korruptionsmuster.

Für die Mittelwertschätzung bei mehrdimensionalen Gaußverteilungen und bei linearen Regressionsmodellen wird die minimax‑Rate für den quadratischen Fehler bis auf einen Faktor von √d, wobei d die Dimension ist, bestimmt. Diese Resultate zeigen, dass die optimale Schätzung in der Praxis Stichproben, die über einem bestimmten Korruptions­schwellenwert liegen, aussortieren kann.

Der Schwellenwert wird dabei durch die empirische Verteilung der gegebenen Korruptionsraten bestimmt, was die praktische Anwendbarkeit der Theorie in realen verteilten Systemen deutlich erhöht.

Ähnliche Artikel