KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Plateaus”

Vermeidung von Lernstillstand PPO Skalierung auf 1 Million Parallelumgebungen

Plateaus – Phasen, in denen ein Agent bei PPO nicht mehr Fortschritte macht – sind ein häufiges Problem in der on‑policy‑Reinforcement‑Lear…

arXiv – cs.LG 09.03.2026 04:00

Preconditioning verbessert Flow-Matching-Training durch bessere Konditionierung

Ein neues Papier auf arXiv beleuchtet, wie die Geometrie der Zwischendichten in Flow‑Matching‑ und score‑basierten Diffusionsmodellen die O…

arXiv – cs.LG 04.03.2026 05:00

Fixierte Pole in RNNs: Effizientere Online-Training für Echtzeit-Anwendungen

Eine neue Untersuchung auf arXiv beleuchtet, warum das Lernen der Pole in rekurrenten neuronalen Netzen (RNNs) bei Echtzeit-Online-Training…

arXiv – cs.LG 26.02.2026 05:00

Student Guides Teacher: Spectral Orthogonal Exploration steigert LLM-Logik um 62 %

Große Sprachmodelle (LLMs) erreichen inzwischen nahezu menschliche Leistungen, doch bei komplexen mathematischen Beweisen und langfristigen…

arXiv – cs.AI 13.01.2026 05:00

Reinforcement Learning initiiert Variationsquantumalgorithmen – Barren Plateaus überwunden

Variationsquantumalgorithmen (VQAs) gelten als vielversprechende Methode, um aktuelle Quantencomputer für Optimierungsaufgaben, Chemiesimul…

arXiv – cs.LG 27.08.2025 05:00

Neue Methode verbessert LLMs bei unüberwachtem Lernen um 68 %

Die neuesten Fortschritte bei großen Sprachmodellen haben die Leistung bei komplexen Rechenaufgaben wie Mathematik und Programmieren deutli…

arXiv – cs.LG 18.08.2025 05:00