Randomisierte Algorithmen verbessern Online-Strategische Klassifikation

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

In der Online‑Klassifikation, bei der Agenten ihre Merkmale gezielt anpassen, um positive Vorhersagen zu erhalten, sind randomisierte Algorithmen bislang kaum untersucht worden. Das neue Papier zeigt, dass diese Verfahren in strategischen Umgebungen erhebliche Vorteile bieten können.

Für den realizierbaren Fall liefert die Arbeit erstmals einen allgemeinen unteren Grenzwert für randomisierte Lernende. Unter der Bedingung T > Ldim(ℋ) Δ² gilt nun Ω(Ldim(ℋ) Δ), was die bisher bekannten deterministischen Grenzen erweitert. Gleichzeitig wird ein neuer randomisierter Lernalgorithmus vorgestellt, der die bekannte deterministische obere Schranke von O(Ldim(ℋ) · Δ log Δ) verbessert.

Im agnostischen Setting präsentiert das Papier einen eigentlichen Lernalgorithmus, der auf konvexen Optimierungstechniken basiert und die Regret‑Schranke weiter verkürzt. Damit wird ein bedeutender Schritt in Richtung der klassischen Online‑Lernrate O(√T log|ℋ|) unternommen, während gleichzeitig die strategische Komplexität berücksichtigt wird.

Ähnliche Artikel