C2: Verbesserter Decision Transformer für Auto‑Bidding mit Constraint‑Loss

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Der neue Forschungsbeitrag „C2: Cross learning module enhanced decision transformer with Constraint‑aware loss for auto‑bidding“ präsentiert einen innovativen Ansatz zur Optimierung von automatisierten Gebotsstrategien. Durch die Kombination eines Cross‑Learning‑Blocks (CLB) und eines Constraint‑aware Loss (CL) adressiert C2 zwei zentrale Schwächen des bisherigen Decision Transformers (DT).

DTs Fähigkeit, zeitliche Abhängigkeiten in Gebotsdaten zu erfassen, ist bislang durch unzureichende Modellierung der Kreuzkorrelationen zwischen Zustands-, Aktions- und Return‑to‑Go‑Sequenzen sowie durch das gleichzeitige Lernen von optimalen und suboptimalen Verhaltensmustern eingeschränkt. C2 löst diese Probleme, indem der CLB mittels Cross‑Attention die Interaktion zwischen den Sequenzen stärkt und der CL Budget‑ und Cost‑Per‑Acquisition‑Constraints berücksichtigt, um gezielt optimale Trajektorien zu lernen.

In umfangreichen Offline‑Tests auf dem AuctionNet‑Datensatz erzielt C2 konsistente Leistungssteigerungen – bis zu 3,23 % besser als der aktuelle Spitzenreiter GAVE – über verschiedene Budget‑Einstellungen hinweg. Ablationsstudien zeigen, dass die Synergie zwischen CLB und CL entscheidend für die überlegene Performance ist. Der komplette Code zur Reproduzierbarkeit der Ergebnisse ist öffentlich auf GitHub verfügbar.

Ähnliche Artikel