Neuer Ansatz: In-Context Operator Learning für optimale Transportkarten

arXiv – cs.LG Original ≈1 Min. Lesezeit
Anzeige

Wissenschaftler haben einen innovativen Ansatz vorgestellt, der es ermöglicht, die optimale Transportkarte zwischen zwei Wahrscheinlichkeitsverteilungen direkt aus wenigen Stichproben zu lernen – ohne dass bei der Inferenz Gradientupdates nötig sind. Dieser „In-Context Operator Learning“ nutzt ein einziges Modell, das auf Basis eines kurzen Prompts aus beiden Verteilungen die Transportkarte berechnet.

Der Beitrag unterscheidet zwei Szenarien: Im nichtparametrischen Fall, wenn die Aufgaben auf einer niedrigdimensionalen Mannigfaltigkeit von Quell- und Zielverteilungen liegen, liefert die Arbeit allgemeine Generalisierungsgrenzen. Diese zeigen, wie die Genauigkeit mit der Promptgröße, der intrinsischen Dimension der Aufgabe und der Kapazität des Modells skaliert. Im parametrischen Fall, etwa bei Gaußschen Familien, wird eine konkrete Architektur präsentiert, die die exakte Transportkarte im Kontext rekonstruiert und dabei endlich-sample-excess-risk-Boundes liefert.

Numerische Experimente auf synthetischen Transportaufgaben sowie auf Benchmarks des generativen Modellierens bestätigen die Wirksamkeit des Frameworks. Der Ansatz eröffnet neue Möglichkeiten für schnelle, datenintensive Anwendungen in der optimalen Transportforschung und darüber hinaus.

Ähnliche Artikel