Suche nach Lernkurve | meineki.news

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

Mathematisches Denken in großen Sprachmodellen erfordert bislang riesige Datensätze, doch die Effizienz der Datenverwendung bleibt ein ents…

arXiv – cs.AI 06.03.2026 05:00

Forschung

KI-Assistent revolutioniert Wissensmanagement und Schulung in deutschen Verkehrsbehörden

Ein neues KI-System, das auf Retrieval‑Augmented Generation (RAG) basiert, verspricht, die Art und Weise zu verändern, wie staatliche Verke…

arXiv – cs.AI 05.03.2026 05:00

Forschung

ParEVO: KI-generierte Parallelalgorithmen für unregelmäßige Daten – 106‑facher Speedup

Der Sprung von sequentiellen zu parallelen Systemen ist für moderne Hochleistungsanwendungen unverzichtbar, doch die steile Lernkurve der C…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Variationsinferenz verbessert parallele Token‑Generierung bei MDMs

Maskierte diskrete Diffusionsmodelle (MDMs) ermöglichen die gleichzeitige Erzeugung mehrerer Tokens und bieten damit eine vielversprechende…

arXiv – cs.LG 02.03.2026 05:00

Forschung

LLM-gestützte Knowledge Tracing: Hyperbolische Hierarchie für Lernfortschritt

Ein neues Forschungsprojekt aus dem Bereich der Lernanalyse präsentiert L-HAKT, ein innovatives Modell, das große Sprachmodelle (LLMs) nutz…

arXiv – cs.AI 27.02.2026 05:00

Forschung

Muon+ verbessert Muon-Optimierer durch zusätzliche Normalisierung

Der Muon-Optimierer hat bereits bei der Vortrainierung großer Sprachmodelle vielversprechende Ergebnisse erzielt, indem er Gradienten (oder…

arXiv – cs.LG 26.02.2026 05:00

Forschung

Metriken zur Aufgabenkomplexität in Robotik: Ergebnisse überraschen

Reinforcement Learning hat in den letzten Jahren enorme Fortschritte in Robotik und Sprachverarbeitung erzielt. Ein zentrales Problem bleib…

arXiv – cs.LG 24.02.2026 05:00

Forschung

EduResearchBench: Neue Benchmark für KI-gestützte Bildungsforschung

Mit dem neuen EduResearchBench wird die Leistungsfähigkeit von Large Language Models (LLMs) im Bereich der Bildungsforschung systematisch b…

arXiv – cs.AI 18.02.2026 05:00

Forschung

Adaptive Meilenstein‑Belohnung verbessert GUI-Agenten um 10 %

Reinforcement Learning (RL) hat sich als Standardverfahren für die Schulung von mobilen GUI‑Agenten etabliert, stößt jedoch bei Aufgaben mi…

arXiv – cs.LG 13.02.2026 05:00

Aktuell

Codex: Der ultimative Weg für PMs, ChatGPT optimal zu nutzen

Produktmanager, die ChatGPT nicht nur als Chatbot, sondern als vollwertiges Tool einsetzen, können ihre Produktivität um ein Vielfaches ste…

Aakash Gupta – AI & Product 10.02.2026 00:06

Forschung

LLM-Agenten erreichen MBA-Qualität bei Verhandlungen – neue Benchmark PieArena

Eine neue Studie aus dem Bereich der künstlichen Intelligenz präsentiert PieArena, ein umfangreiches Verhandlungsbenchmark, das reale Szena…

arXiv – cs.AI 06.02.2026 05:00

Aktuell

KI-Agenten: 2026 wird ein Boom trotz Herausforderungen

Neue Studien zeigen, dass die Einführung von KI‑Agenten in Unternehmen im Jahr 2026 deutlich zunehmen wird – sowohl die Anzahl der eingeset…

ZDNet – Artificial Intelligence 05.02.2026 17:03

Forschung

Adaptive komplexe Abfrageoptimierung mittels Reinforcement Learning

In der heutigen Welt der Retrieval‑Augmented‑Generation (RAG) Systeme spielt die Optimierung von Suchanfragen eine entscheidende Rolle. Wäh…

arXiv – cs.AI 30.01.2026 05:00

Forschung

Frühzeitiges Stoppen macht Loss‑Reweighting wirksam – Trainingsdynamik

In der aktuellen Forschung zeigt sich, dass die Technik des Loss‑Reweightings in modernen Deep‑Learning‑Modellen vor allem in den frühen Tr…

arXiv – cs.LG 21.01.2026 05:00

Forschung

LLMs zeigen bei RLVR lineare Lernkurve – Extrapolation spart Rechenzeit Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) ist heute ein wesentlicher Bestandteil der Nachschulung großer Sprachmodelle. Im Gegensatz zum klassischen Supervised Fine‑Tuning erzeugt ein LLM bei RLVR mehrere Kandidaten und belohnt nur jene, die zu einer verifizierbar korrekten Endantwort führen. In der Praxis erfordert RLVR jedoch oft Tausende von Trainingsschritten, was enorme Rechenressourcen beansprucht – h

arXiv – cs.LG 09.01.2026 05:00

Forschung

KI-gestütztes Seismologie-Tool: Intelligenter Assistent für Geophysiker

Die traditionelle Nutzung von SPECFEM, dem führenden Open‑Source‑Softwarepaket für seismische Wellensimulationen, ist oft mit einer steile…

arXiv – cs.AI 17.12.2025 05:00

Forschung

Adaptive Lernratenplanung nach Verluständerungen beschleunigt Konvergenz

In einer neuen Studie aus dem arXiv-Repository wird der Scheduler GreedyLR vorgestellt, der die Lernrate während des Trainings dynamisch an…

arXiv – cs.AI 17.12.2025 05:00

Forschung

KI-Co-Künstler: LLM-gesteuertes System für interaktive Shader-Animationen

In der Welt des kreativen Codings und der Echtzeit-Shader-Programmierung eröffnet KI-Co-Künstler neue Wege, komplexe visuelle Effekte zu er…

arXiv – cs.AI 11.12.2025 05:00

Forschung

LLM-Bewertung als Wettsystem: Mehr Genauigkeit und klare Vertrauenssignale

In einer neuen Pilotstudie wurde untersucht, ob die Einbettung von LLM‑Bewertungen in ein fiktives Wettsystem die Vorhersagegenauigkeit ste…

arXiv – cs.AI 09.12.2025 05:00

Forschung

Schnelle Lernkurve: 3D‑Rotations‑Equivariance in Modellen in 10k Schritten

Ein neues arXiv-Preprint beleuchtet, wie schnell Modelle 3D‑Rotations‑Equivariance erlernen und welche Vorteile dies für hochdimensionale M…

arXiv – cs.LG 03.12.2025 05:00

Forschung

KI lernt 3D-Visuospatiale Aufgaben dank menschlich gestalteter Lernkurve

Reinforcement Learning (RL) gilt als ausgereifte Technologie, die als möglicher Weg zur Erreichung einer allgemeinen künstlichen Intelligen…

arXiv – cs.LG 25.11.2025 05:00

Forschung

QuickLAP: Sprach- und physische Rückmeldungen vereint für autonomes Fahren

Autonome Fahrzeuge müssen aus dem Verhalten und den Worten der Menschen lernen. Allein physische Korrekturen liefern zwar klare Signale, bl…

arXiv – cs.AI 25.11.2025 05:00

Forschung

OpenMMReasoner: Transparentes multimodales Rezept, 11,6 % besser als Qwen2.5

In einer kürzlich veröffentlichten Arbeit auf arXiv präsentiert das EvolvingLMMs‑Lab das OpenMMReasoner‑Rezept, das die Grenzen multimodale…

arXiv – cs.AI 21.11.2025 05:00

Forschung

DAS beschleunigt RL-Training: Spekulatives Decoding nutzt Rollout-Verteilung

Reinforcement‑Learning‑Post‑Training ist heute unverzichtbar, um große Sprachmodelle (LLMs) zu verfeinern. Dabei wird die Effizienz zunehme…

arXiv – cs.LG 19.11.2025 05:00

Aktuell

Microsoft integriert mehr KI in Windows – Was bedeutet das für Nutzer?

Microsoft hat die Integration von KI in Windows beschleunigt und präsentiert neue KI-gestützte Funktionen. Doch die Begeisterung der Nutzer…

ZDNet – Artificial Intelligence 18.11.2025 16:00

Praxis

So bauen Sie überwachte KI-Modelle, wenn Sie keine annotierten Daten haben

In der Praxis ist es häufig so, dass die Daten, mit denen Sie starten, völlig unlabelt sind. Für überwachte Lernmodelle ist ein gelabeltes…

MarkTechPost 03.11.2025 23:58

Aktuell

KI‑Codierung: Revolution oder Gefahr für die Ingenieurgeneration?

KI‑Tools verändern die Softwareentwicklung grundlegend, indem sie wiederkehrende Aufgaben automatisieren, überladene Code‑Strukturen neu or…

VentureBeat – AI 11.10.2025 20:00

Forschung

LLMs als Prüfungs-Orakel für Solidity: GPT‑5 überzeugt bei Smart‑Contract‑Audit Die Sicherheit von Smart Contracts ist entscheidend, denn selbst kleine Fehler können zu erheblichen finanziellen Verlusten führen. Während klassische Bug‑Detection‑Tools häufig bekannte Schwachstellen erkennen, entstehen die meisten realen Angriffe durch Fehler in der Geschäftslogik des Vertrags. Formale Verifikationswerkzeuge wie SolCMC und der Certora Prover adressieren dieses Problem, stoßen jedoch an Lernkurven un

arXiv – cs.AI 26.09.2025 05:00

Forschung

Diagonal-SSM-Initialisierung enthüllt Frequenzbias – neue S4D-DFouT-Variante

In der Welt der Zustandsraummodelle (SSMs) dominierte bislang das HiPPO‑Framework als Standard für die Initialisierung der Modellparameter…

arXiv – cs.LG 29.08.2025 05:00

Forschung

SWIRL: Staged Workflow verbessert Multi-Agent RL für mobile GUI-Steuerung

Die neueste Veröffentlichung auf arXiv (2508.20018v1) stellt SWIRL vor – ein innovatives, gestaffeltes Lernverfahren, das Multi-Agent Reinf…

arXiv – cs.AI 28.08.2025 05:00

Finde Modelle, Firmen und Themen

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

KI-Assistent revolutioniert Wissensmanagement und Schulung in deutschen Verkehrsbehörden

ParEVO: KI-generierte Parallelalgorithmen für unregelmäßige Daten – 106‑facher Speedup

Variationsinferenz verbessert parallele Token‑Generierung bei MDMs

LLM-gestützte Knowledge Tracing: Hyperbolische Hierarchie für Lernfortschritt

Muon+ verbessert Muon-Optimierer durch zusätzliche Normalisierung

Metriken zur Aufgabenkomplexität in Robotik: Ergebnisse überraschen

EduResearchBench: Neue Benchmark für KI-gestützte Bildungsforschung

Adaptive Meilenstein‑Belohnung verbessert GUI-Agenten um 10 %

Codex: Der ultimative Weg für PMs, ChatGPT optimal zu nutzen

LLM-Agenten erreichen MBA-Qualität bei Verhandlungen – neue Benchmark PieArena

KI-Agenten: 2026 wird ein Boom trotz Herausforderungen

Adaptive komplexe Abfrageoptimierung mittels Reinforcement Learning

Frühzeitiges Stoppen macht Loss‑Reweighting wirksam – Trainingsdynamik

KI-gestütztes Seismologie-Tool: Intelligenter Assistent für Geophysiker

Adaptive Lernratenplanung nach Verluständerungen beschleunigt Konvergenz

KI-Co-Künstler: LLM-gesteuertes System für interaktive Shader-Animationen

LLM-Bewertung als Wettsystem: Mehr Genauigkeit und klare Vertrauenssignale

Schnelle Lernkurve: 3D‑Rotations‑Equivariance in Modellen in 10k Schritten

KI lernt 3D-Visuospatiale Aufgaben dank menschlich gestalteter Lernkurve

QuickLAP: Sprach- und physische Rückmeldungen vereint für autonomes Fahren

OpenMMReasoner: Transparentes multimodales Rezept, 11,6 % besser als Qwen2.5

DAS beschleunigt RL-Training: Spekulatives Decoding nutzt Rollout-Verteilung

Microsoft integriert mehr KI in Windows – Was bedeutet das für Nutzer?

So bauen Sie überwachte KI-Modelle, wenn Sie keine annotierten Daten haben

KI‑Codierung: Revolution oder Gefahr für die Ingenieurgeneration?<br/>

Diagonal-SSM-Initialisierung enthüllt Frequenzbias – neue S4D-DFouT-Variante

SWIRL: Staged Workflow verbessert Multi-Agent RL für mobile GUI-Steuerung

Finde Modelle, Firmen und Themen

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

KI-Assistent revolutioniert Wissensmanagement und Schulung in deutschen Verkehrsbehörden

ParEVO: KI-generierte Parallelalgorithmen für unregelmäßige Daten – 106‑facher Speedup

Variationsinferenz verbessert parallele Token‑Generierung bei MDMs

LLM-gestützte Knowledge Tracing: Hyperbolische Hierarchie für Lernfortschritt

Muon+ verbessert Muon-Optimierer durch zusätzliche Normalisierung

Metriken zur Aufgabenkomplexität in Robotik: Ergebnisse überraschen

EduResearchBench: Neue Benchmark für KI-gestützte Bildungsforschung

Adaptive Meilenstein‑Belohnung verbessert GUI-Agenten um 10 %

Codex: Der ultimative Weg für PMs, ChatGPT optimal zu nutzen

LLM-Agenten erreichen MBA-Qualität bei Verhandlungen – neue Benchmark PieArena

KI-Agenten: 2026 wird ein Boom trotz Herausforderungen

Adaptive komplexe Abfrageoptimierung mittels Reinforcement Learning

Frühzeitiges Stoppen macht Loss‑Reweighting wirksam – Trainingsdynamik

KI-gestütztes Seismologie-Tool: Intelligenter Assistent für Geophysiker

Adaptive Lernratenplanung nach Verluständerungen beschleunigt Konvergenz

KI-Co-Künstler: LLM-gesteuertes System für interaktive Shader-Animationen

LLM-Bewertung als Wettsystem: Mehr Genauigkeit und klare Vertrauenssignale

Schnelle Lernkurve: 3D‑Rotations‑Equivariance in Modellen in 10k Schritten

KI lernt 3D-Visuospatiale Aufgaben dank menschlich gestalteter Lernkurve

QuickLAP: Sprach- und physische Rückmeldungen vereint für autonomes Fahren

OpenMMReasoner: Transparentes multimodales Rezept, 11,6 % besser als Qwen2.5

DAS beschleunigt RL-Training: Spekulatives Decoding nutzt Rollout-Verteilung

Microsoft integriert mehr KI in Windows – Was bedeutet das für Nutzer?

So bauen Sie überwachte KI-Modelle, wenn Sie keine annotierten Daten haben

KI‑Codierung: Revolution oder Gefahr für die Ingenieurgeneration?<br/>

Diagonal-SSM-Initialisierung enthüllt Frequenzbias – neue S4D-DFouT-Variante

SWIRL: Staged Workflow verbessert Multi-Agent RL für mobile GUI-Steuerung

🍪 Cookie-Einstellungen

Adaptive Meilenstein‑Belohnung verbessert GUI-Agenten um 10 %

OpenMMReasoner: Transparentes multimodales Rezept, 11,6 % besser als Qwen2.5