Training‑freie Verteilungsanpassung für Diffusionsmodelle mittels MMD‑Guidance
Pre‑trainierte Diffusionsmodelle haben sich als äußerst leistungsfähige generative Werkzeuge etabliert, doch ihre Ausgaben passen häufig nicht exakt zu den Merkmalen von benutzerspezifischen Ziel‑Datensätzen. Dieses Problem wird besonders deutlich bei Domain‑Adaptation‑Aufgaben, bei denen nur wenige Referenzbeispiele vorliegen und ein erneutes Training des Modells praktisch unmöglich ist.
Aktuelle Verfahren zur Anpassung während der Inferenz optimieren meist Stellvertreter‑Ziele wie Klassifikator‑Wahrscheinlichkeiten, anstatt die Zielverteilung direkt zu adressieren. Hier setzt die neue Methode MMD Guidance an: Sie ist komplett training‑frei und ergänzt den Rückwärts‑Diffusionsprozess um Gradienten des Maximum Mean Discrepancy (MMD) zwischen generierten Samples und einem kleinen Referenz‑Datensatz.
MMD liefert zuverlässige Verteilungsschätzungen auch bei begrenzten Datenmengen, weist in der Praxis eine geringe Varianz auf und ist effizient differenzierbar – Eigenschaften, die es besonders gut für die Guidance‑Aufgabe geeignet machen. Das Konzept lässt sich zudem nahtlos auf prompt‑bewusste Anpassungen in bedingten Generationsmodellen übertragen, indem Produkt‑Kernels eingesetzt werden.
Ein weiterer Vorteil besteht darin, dass die Guidance im latenten Raum von Latent Diffusion Models (LDMs) ausgeführt werden kann, was die Rechenkosten deutlich reduziert. Experimentelle Ergebnisse auf synthetischen und realen Benchmarks zeigen, dass MMD Guidance die Verteilung der generierten Daten erfolgreich an die Zielverteilung anpasst, ohne die Bild‑Fidelity zu beeinträchtigen.