Forschung arXiv – cs.LG

Vermeidung von Curriculum‑Kollaps in selbstentwickelnden Denkmodellen

17.03.2026 04:00 • ≈1 Min. Lesezeit • Originalquelle

#PRISM #Self‑Evolving #Diversity‑Collapse #Zone‑of‑Proximal‑Development #Reasoning‑Benchmarks #R‑Zero

Kernaussagen

Das nimmst du aus dem Beitrag mit

Selbstentwickelnde Denkframeworks ermöglichen es großen Sprachmodellen, ihre Rechenfähigkeiten zu verbessern, indem sie ohne externe Anleitung fortlaufend neue Aufgaben…
Trotz dieser vielversprechenden Idee zeigen neuere Untersuchungen, dass solche Systeme nach nur wenigen Iterationen einen „Diversity‑Collapse“ erleben können – die Vielf…
Um diesem Problem entgegenzuwirken, stellt das neue Verfahren Prism vor.

Selbstentwickelnde Denkframeworks ermöglichen es großen Sprachmodellen, ihre Rechenfähigkeiten zu verbessern, indem sie ohne externe Anleitung fortlaufend neue Aufgaben generieren und lösen. Trotz dieser vielversprechenden Idee zeigen neuere Untersuchungen, dass solche Systeme nach nur wenigen Iterationen einen „Diversity‑Collapse“ erleben können – die Vielfalt der erzeugten Aufgaben nimmt ab, obwohl die Oberflächenvariation erhalten bleibt.

Um diesem Problem entgegenzuwirken, stellt das neue Verfahren Prism vor. Prism definiert ein dauerhaftes Diversitätssignal, das auf einer semantischen Partition mathematischer Aufgaben basiert, und nutzt dieses Signal, um eine ausgewogene Erkundung bislang unterrepräsentierter Problemregionen zu fördern. Gleichzeitig wird ein Zone‑of‑Proximal‑Development‑Gate eingesetzt, das sicherstellt, dass die Schwierigkeitsstufe der Aufgaben am Rand der Lösbarkeit bleibt.

In umfangreichen Tests auf sieben etablierten mathematischen Reasoning‑Benchmarks übertrifft Prism fünf bestehende Self‑Evolving‑Baselines. Es erzielt die höchste Genauigkeit bei sechs der sieben Aufgaben und erzielt dabei signifikante Verbesserungen gegenüber dem R‑Zero‑Modell: +3,98 Punkte auf AMC und +3,68 Punkte auf Minerva Math.

Prism generiert zudem über die Iterationen hinweg semantisch vielfältige und anspruchsvolle Fragen, was zur Erstellung des Prism‑Math‑Datensatzes mit 100 000 mathematischen Fragen geführt hat. Diese Ergebnisse unterstreichen, dass die über Iterationen hinweg erzielte semantische Abdeckung ein bislang wenig genutzter, aber hochwirksamer Ansatz zur Entwicklung robuster Rechenmodelle darstellt.

Einordnen in 60 Sekunden

Welche Linse du auf diese Meldung legen solltest

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

Was veraendert sich praktisch?

Ist das eher Signal, Produkt oder nur kurzfristiger Hype?

Begriffe zum Einordnen

Kontext ohne Glossar-Suche

PRISM

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Self‑Evolving

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

Diversity‑Collapse

Dieses Thema ist relevant, weil es zeigt, wie sich KI-Produkte, Modelle oder Rahmenbedingungen in der Praxis verschieben.

arXiv – cs.LG

Diese Quelle setzt den Ausgangspunkt fuer die Meldung. Pruefe immer, ob sie eher Forschung, Produktmarketing oder Praxisperspektive liefert.

Lernpfad

Wenn du nach dieser Meldung weiterlernen willst

Themen-Hub

PRISM systematisch verfolgen

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

Archiv

Weitere Beispiele zu PRISM

Nutze das Archiv, um Muster, Wiederholungen und Trendlinien innerhalb des Themas zu sehen.

Im Themen-Cluster weiter

Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen

Themen-Hub

PRISM

Achte zuerst darauf, was sich fuer Nutzer, Builder oder Unternehmen konkret veraendert und ob daraus ein nachhaltiger Trend entsteht.

3 Signale in 7 Tagen • 12 Artikel im Hub

Hub oeffnen →

Nachbar-Hub

Robustheit

Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.

3 gemeinsame Signale

Nachbar-Hub

OpenAI

Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.

3 gemeinsame Signale

Nachbar-Hub

Reinforcement Learning

Dieses Thema taucht in denselben KI-Entwicklungen regelmaessig mit auf und hilft beim groesseren Bild.

2 gemeinsame Signale

Naechste Schritte

Aehnliche Entwicklungen zum Weiterlesen

arXiv – cs.LG

Rauschen zerstört Verstärkendes Lernen mit verifizierbaren Belohnungen

18.03.2026 04:00

arXiv – cs.AI

M-GRPO: Stabile selbstüberwachende RL-Optimierung für LLMs dank Momentum

16.12.2025 05:00

arXiv – cs.AI

PPO, GRPO und DAPO: Vergleich und Parametertuning für bessere LLM‑Logik

09.12.2025 05:00

arXiv – cs.AI

PRiSM: Neuer multimodaler Benchmark für wissenschaftliches Denken mit Python

08.12.2025 05:00

arXiv – cs.LG

PRISM: Mid-Training steigert LLM-Leistung um bis zu 40 Punkte in Mathematik

19.03.2026 04:00

arXiv – cs.AI

Expert Personas verbessern LLM-Ausrichtung, schaden Genauigkeit – PRISM hilft

20.03.2026 04:00

Warum das wichtig ist

Relevant fuer Leserinnen und Leser, die KI nicht nur verfolgen, sondern einordnen wollen: Der Beitrag zeigt, was sich bei PRISM, Self‑Evolving konkret verschiebt und welche Folgen das fuer Nutzung, Produkte oder Entscheidungen haben kann. Ausgangspunkt ist die Quelle arXiv – cs.LG.

Quellenklarheit

Quelle: arXiv – cs.LG
Original: Zum Ursprungsbeitrag
Website: arXiv – cs.LG

Themenradar

Themen folgen

PRISM

Self‑Evolving

Diversity‑Collapse

Zone‑of‑Proximal‑Development

Morning Briefing

Diese Themen im Briefing verfolgen

Wenn dich genau diese Themen wieder interessieren werden, mach daraus einen festen Morgen-Slot statt einzelner Zufallsklicks.

Briefing mit Fokus konfigurieren →

Welche Linse du auf diese Meldung legen solltest

Kontext ohne Glossar-Suche

Wenn du nach dieser Meldung weiterlernen willst

Von dieser Meldung direkt in Hub, Analyse und Nachbarthemen

Aehnliche Entwicklungen zum Weiterlesen

🍪 Cookie-Einstellungen