Forschung arXiv – cs.AI

DARA: KI-gestützte Budgetallokation in Online‑Werbung mit Few‑Shot‑Ansatz

Werbetreibende stehen vor der komplexen Aufgabe, den Gesamtwert gewonnenen Impressionen innerhalb knapper Budgets zu maximieren. Dabei fehlt häufig umfangreiche Historie, sodass klassische Reinforcement‑Learning‑Methode…

≈1 Min. Lesezeit Originalquelle
Visuelle Illustration fuer KI-Kontext
Kernaussagen
Das nimmst du aus dem Beitrag mit
  • Werbetreibende stehen vor der komplexen Aufgabe, den Gesamtwert gewonnenen Impressionen innerhalb knapper Budgets zu maximieren.
  • Dabei fehlt häufig umfangreiche Historie, sodass klassische Reinforcement‑Learning‑Methoden kaum effektiv arbeiten können.
  • Große Sprachmodelle (LLMs) bieten hier einen vielversprechenden Ansatz: Durch in‑Kontext‑Lernen lassen sich aus wenigen Beispielen generalisieren.

Werbetreibende stehen vor der komplexen Aufgabe, den Gesamtwert gewonnenen Impressionen innerhalb knapper Budgets zu maximieren. Dabei fehlt häufig umfangreiche Historie, sodass klassische Reinforcement‑Learning‑Methoden kaum effektiv arbeiten können.

Große Sprachmodelle (LLMs) bieten hier einen vielversprechenden Ansatz: Durch in‑Kontext‑Lernen lassen sich aus wenigen Beispielen generalisieren. Allerdings mangelt es ihnen an der nötigen numerischen Präzision für fein abgestimmte Optimierungen. Um dieses Defizit zu beheben, wurde GRPO‑Adaptive entwickelt – ein Post‑Training‑Verfahren, das die Referenzpolicy während des Lernens dynamisch anpasst und so sowohl das logische Denken als auch die Zahlenpräzision verbessert.

Auf dieser Basis stellt DARA ein zweiphasiges Framework vor. In der ersten Phase nutzt ein „Few‑Shot‑Reasoner“ in‑Kontext‑Prompting, um grobe Pläne zu generieren. Anschließend verfeinert ein „Fine‑Grained Optimizer“ diese Pläne mithilfe von feedback‑gestütztem Denken. Durch diese Trennung können die Stärken der LLMs mit der erforderlichen Genauigkeit für Online‑Bidding‑Aufgaben kombiniert werden.

Umfangreiche Tests an realen und synthetischen Datensätzen zeigen, dass DARA die bestehenden Baselines in Bezug auf den kumulativen Werbewert unter Budgetbeschränkungen konsequent übertrifft. Damit eröffnet die Methode neue Möglichkeiten für effiziente, datenarme Werbestrategien im digitalen Raum.

Einordnen in 60 Sekunden

Welche Linse du auf diese Meldung legen solltest

LLMs sind Sprachmodelle, die Text verstehen, erzeugen und in Produkte eingebettet werden.

Achte zuerst auf Modellqualitaet, Kosten pro Nutzung und darauf, ob echte Produktverbesserungen oder nur Benchmarks kommuniziert werden.

Welches konkrete Problem loest das Modell besser als bisher?
Was bedeutet die Neuerung fuer Geschwindigkeit, Kosten oder Zuverlaessigkeit?
Was veraendert sich praktisch?
Begriffe zum Einordnen

Kontext ohne Glossar-Suche

LLM
LLMs sind Sprachmodelle, die Text verstehen, erzeugen und in Produkte eingebettet werden.
In-Context-Lernen
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
GRPO-Adaptiv
Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.
arXiv – cs.AI
Diese Quelle setzt den Ausgangspunkt fuer die Meldung. Pruefe immer, ob sie eher Forschung, Produktmarketing oder Praxisperspektive liefert.
Naechste Schritte

Aehnliche Entwicklungen zum Weiterlesen