KI News: Kurz und klar.

Anmelden

Predicting Training Re-evaluation Curves Enables Effective Data Curriculums for LLMs

arXiv – cs.LG • 01.10.2025 05:00 • Original

#LLM-Training #Datenkurrikulum #TREC #AdamW #EMA #Curriculum-Design #Kontinuierliches Pre-Training #Datenplatzierung

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 21.01.2026 05:00

AdaFRUGAL: Automatisiertes, speichereffizientes Training von LLMs

arXiv – cs.AI • 22.12.2025 05:00

GPA: Generalisierte Primal‑Averaging beschleunigt LLM‑Training ohne Mehrloop

arXiv – cs.LG • 10.12.2025 05:00

LayerPipe2: Mehrstufiges Pipelining mit optimiertem EMA für NN-Training

arXiv – cs.LG • 10.12.2025 05:00

Neuer Ansatz: Gewichtungsabklingung neu: Lernrate² statt Lernrate stabilisiert Training

arXiv – cs.LG • 08.12.2025 05:00

Matrix-Preconditionierte Optimierer liefern stabile Geschwindigkeitsvorteile Skalierung

arXiv – cs.LG • 12.11.2025 05:00

DP-AdamW: Neue Optimierer für privates Deep Learning zeigen überlegene Leistung