KI News: Kurz und klar.

Anmelden

MobileRL: Online Agentic Reinforcement Learning for Mobile GUI Agents

arXiv – cs.LG • 24.09.2025 05:00 • Original

#GUI agents #Reinforcement Learning #Mobile #difficulty-adaptive #GRPO #shortest path reward #Sample Efficiency

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 15.09.2025 05:00

Inpainting-Guided Policy Optimization for Diffusion Large Language Models

arXiv – cs.AI • 09.02.2026 05:00

SWIRL: Selbstverbessernde Weltmodellierung ohne Aktionsdaten

arXiv – cs.LG • 30.01.2026 05:00

Weniger Lärm, mehr Stimme: RLVR verbessert LLM-Logik durch Prompt‑Purification

arXiv – cs.AI • 13.01.2026 05:00

GDEPO: Neue Methode steigert Reinforcement-Learning beim automatischen Theorembeweis

arXiv – cs.LG • 12.01.2026 05:00

Dynamische Hybrid-Optimierung: Token- und Sequenz-Strategien vereint

arXiv – cs.LG • 09.01.2026 05:00

Verifizierbare Belohnungen im RL: Wie Rauschen Lernen oder Scheitern lässt