Neues Debiasing verbessert Watch‑Time‑Vorhersage bei Kurzvideos

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Auf Video‑Empfehlungsplattformen wird die Zeit, die Nutzer mit einem Video verbringen, häufig als Indikator für Zufriedenheit verwendet. Doch diese „Watch‑Time“ wird stark von Faktoren wie der Videolänge, der Popularität und individuellen Nutzergewohnheiten beeinflusst, was die Präferenzsignale verzerrt und zu voreingenommenen Modellen führt.

Die neue Methode, ein sogenanntes Relative Advantage Debiasing, korrigiert die Watch‑Time, indem sie sie mit empirisch erstellten Referenzverteilungen vergleicht, die auf Nutzer‑ und Videogruppen basieren. Dadurch entsteht ein quantilbasierter Präferenzsignal, das die tatsächlichen Vorlieben besser widerspiegelt. Das System nutzt eine zweistufige Architektur: Zuerst wird die Verteilung geschätzt, anschließend das Präferenzlernen durchgeführt.

Ein weiteres Highlight ist die Einführung von distributionalen Embeddings, die die Watch‑Time‑Quantile effizient parametrisieren, ohne dass Online‑Sampling oder die Speicherung historischer Daten nötig ist. Sowohl Offline‑ als auch Online‑Tests zeigen, dass diese Technik die Genauigkeit und Robustheit der Empfehlungen deutlich verbessert – deutlich besser als bei bisherigen Ansätzen.

Ähnliche Artikel