KI News: Kurz und klar.

Anmelden

Adaptive Divergence Regularized Policy Optimization for Fine-tuning Generative Models

arXiv – cs.LG • 22.10.2025 05:00 • Original

#Reinforcement Learning #Generative Models #Adaptive Divergence Regularization #Wasserstein-2 #Flow Matching #text-to-image generation #Semantic Alignment #diversity

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 17.11.2025 05:00

ARCTraj: Datensatz mit menschlichen Denkpfaden für abstraktes Problemlösen

arXiv – cs.AI • 11.02.2026 05:00

SpotAgent: LVLMs meistern Geo‑Lokalisierung mit agentischem Denken

arXiv – cs.AI • 11.02.2026 05:00

Erklärbare Kompression von Gedankenketten steigert Effizienz multimodaler Modelle

arXiv – cs.AI • 11.02.2026 05:00

CODE-SHARP: Offene Entdeckung von Fähigkeiten als Belohnungsprogramme

arXiv – cs.AI • 11.02.2026 05:00

Agent World Model: 1.000 synthetische Umgebungen für robuste Agenten-Training

arXiv – cs.LG • 11.02.2026 05:00

Kollaboration von Sprachmodellen über versteckte Zustände