KI News: Kurz und klar.

Anmelden

The Multi-Query Paradox in Zeroth-Order Optimization

arXiv – cs.LG • 22.09.2025 05:00 • Original

#Zeroth-Order-Optimierung #Abfragezuweisung #ZO-Avg #ZO-Align #Konvergenzrate #konvexe Probleme #Stochastische Optimierung

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 28.01.2026 05:00

Beschleunigte Wasserstein-Gradientenflüsse optimieren mehrere Ziele gleichzeitig

arXiv – cs.LG • 05.12.2025 05:00

Neue kontinuierliche Annäherung an SGD ohne Zurücklegen: Optimierung voran

arXiv – cs.AI • 03.12.2025 05:00

<p>Die neue 4/δ‑Grenze liefert für LLM‑Verifikationssysteme ein solides theoretisches Fundament: Sie garantiert die Terminierung und Konvergenz jeder Iteration, solange die Fehler‑Reduktionswahrscheinlichkeit δ positiv ist. Der dazu entwickelte LLM‑Verifier‑Konvergenztheorem modelliert die Interaktion zwischen Sprachmodell und Verifikator als diskrete Zeit‑Markov‑Kette und zeigt, dass die erwartete Anzahl an Durchläufen höchstens 4/δ beträgt.</p>

arXiv – cs.LG • 05.11.2025 05:00

Gradient-Variation Online Adaptivity for Accelerated Optimization with H\"older Smoothness

arXiv – cs.LG • 01.10.2025 05:00

Heterogeneous Multi-agent Collaboration in UAV-assisted Mobile Crowdsensing Networks

arXiv – cs.LG • 22.09.2025 05:00

Policy Gradient Optimzation for Bayesian-Risk MDPs with General Convex Losses