Suche nach Large Reasoning Models

Effizientes Training großer Rechenmodelle durch Progressive Thought Encoding

Große Rechenmodelle für komplexe Aufgaben sind äußerst leistungsfähig, doch ihr Training mit Reinforcement Learning (RL) bleibt ein Engpass…

arXiv – cs.LG 20.02.2026 05:00

Forschung

RFEval: Benchmark zur Messung der Glaubwürdigkeit von KI-Argumenten

Neues Forschungswerkzeug namens RFEval prüft, ob die Argumente großer KI-Modelle wirklich ihre Entscheidungen erklären oder nur überzeugend…

arXiv – cs.AI 20.02.2026 05:00

Forschung

<h1>Große Rechenmodelle zeigen bei Mehrfachangriffen Schwächen</h1> <p>Neuste Forschungsergebnisse zeigen, dass große Rechenmodelle, die komplexe Schlussfolgerungen ziehen können, zwar Spitzenleistungen bei anspruchsvollen Aufgaben erbringen, aber unter mehrstufiger, gezielter Angriffsbelastung nicht automatisch robust bleiben. In einer umfassenden Studie wurden neun der fortschrittlichsten Rechenmodelle auf ihre Widerstandsfähigkeit gegen gezielte Angriffe getestet.</p> <p>Die Ergebnisse sind eindeutig: Mo

arXiv – cs.AI 16.02.2026 05:00

Forschung

Große Sprachmodelle zeigen Schwächen bei Theory of Mind-Aufgaben Eine aktuelle Untersuchung aus dem arXiv‑Repository analysiert, ob die jüngsten Fortschritte bei Großen Rechenmodellen (LRMs) – die für Schritt‑für‑Schritt‑Rechnungen in Mathematik und Programmierung glänzen – auch auf sozialkognitive Fähigkeiten übertragen werden können. Dabei wurden neun hochentwickelte Große Sprachmodelle (LLMs) systematisch auf drei repräsentativen Theory of Mind (ToM)-Benchmarks getestet, wobei Modelle mit expliziter Re

arXiv – cs.AI 12.02.2026 05:00

Forschung

Erklärbare Kompression von Gedankenketten steigert Effizienz multimodaler Modelle

In multimodalen Rechenmodellen werden lange Gedankenketten (Long CoTs) eingesetzt, um komplexe Aufgaben zu lösen und dabei detaillierte vis…

arXiv – cs.AI 11.02.2026 05:00

Forschung

GrAlgoBench enthüllt Schwächen großer Rechenmodelle bei Graphenalgorithmen

Ein neues Benchmark-Set namens GrAlgoBench, veröffentlicht auf arXiv (2602.06319v1), richtet sich gezielt an große Rechenmodelle (LRMs) und…

arXiv – cs.AI 09.02.2026 05:00

Forschung

DEPO: Mit Schwierigkeitsbewertung die Kosten für Rollouts halbieren

Ein neues arXiv-Papier präsentiert DEPO, ein innovatives Verfahren zur Optimierung von Large Reasoning Models (LRMs). Durch die Einführung…

arXiv – cs.AI 09.02.2026 05:00

Forschung

QuantLRM: Gewichtsanpassungen als Schlüssel zur Quantisierung von LLMs

In der Welt der großen Sprachmodelle (LLMs) gewinnt die Gewichtsanpassung bei der Quantisierung zunehmend an Bedeutung. Forscher haben eine…

arXiv – cs.LG 04.02.2026 05:00

Forschung

Self-Guard: Sicherheit für große Rechenmodelle durch verbesserte Selbstreflexion

Die neu auftretenden Large Reasoning Models (LRMs) eröffnen ein völlig neues Feld des expliziten Denkens und ermöglichen damit beeindrucken…

arXiv – cs.AI 03.02.2026 05:00

Forschung

EntroCut: Entropie-gesteuerte Trunkierung steigert Effizienz von Chain-of-Thought-Modellen

Ein neues Verfahren namens EntroCut verspricht, die Rechenkosten von Large Reasoning Models (LRMs) drastisch zu senken, ohne dabei die Gena…

arXiv – cs.AI 02.02.2026 05:00

Forschung

G-PAC und C-PAC: Neue Garantie für effiziente, bedingte Logikmodelle

In der Welt der großen Rechenmodelle, die komplexe Schlussfolgerungen durch ausgedehnte „Chain‑of‑Thought“-Routinen liefern, bleibt die Rec…

arXiv – cs.AI 02.02.2026 05:00

Forschung

Neue Methode steigert Genauigkeit großer Sprachmodelle ohne Trainingsaufwand

Forscher haben eine neue Technik namens Min‑Seek vorgestellt, die die Genauigkeit großer Sprachmodelle bei komplexen Rechenaufgaben deutlic…

arXiv – cs.AI 16.01.2026 05:00

Forschung

<h1>LLMs gegen Halluzinationen: Ein neuer Rahmen für Zuverlässigkeit</h1> <p>Large Language Models (LLMs) und Large Reasoning Models (LRMs) versprechen enorme Fortschritte in Bereichen wie Finanzen und Recht. Doch ihre Neigung, falsche oder unbestätigte Inhalte zu erzeugen – sogenannte Halluzinationen – stellt ein ernstes Vertrauensproblem dar.</p> <p>In einer neuen Studie wird ein umfassendes operatives Rahmenwerk vorgestellt, das Halluzinationen systematisch erkennt und mindert. Der Ansatz basiert auf ein

arXiv – cs.AI 16.01.2026 05:00

Forschung

Neues Verfahren schützt sensible Daten in großen Rechenmodellen

Die Forschung im Bereich der großen Rechenmodelle (LRMs) hat einen bedeutenden Fortschritt erzielt: Mit dem neuen Ansatz „Sensitive Traject…

arXiv – cs.AI 15.01.2026 05:00

Forschung

GIFT: Globale Optimierung nach dem Training durch Gibbs-Initialisierung

Ein neues Verfahren namens GIFT (Gibbs Initialization with Finite Temperature) verspricht, die Leistung von Large Reasoning Models (LRMs) n…

arXiv – cs.LG 15.01.2026 05:00

Forschung

Kreisförmiges Denken: Modelle geraten in selbstverstärkende Schleifen

In einer neuen Studie von Forschern auf arXiv wird ein bislang wenig beachtetes Problem großer Rechenmodelle aufgedeckt: die sogenannte „Ci…

arXiv – cs.AI 12.01.2026 05:00

Forschung

<h1>LLMs lernen aus Fehlern: Fehlerhafte Denkpfade verbessern Mathegenauigkeit</h1> <p>In der Welt der großen Sprachmodelle hat sich die Technik des „Chain‑of‑Thought“ (CoT) Promptings als Schlüssel zur Lösung mathematischer Aufgaben etabliert. Trotz dieser Fortschritte bleiben die Modelle empfindlich gegenüber frühen Fehlern: Ein einziger Rechenfehler oder ein unbegründeter logischer Schritt kann sich unbemerkt fortsetzen und zum endgültigen Ergebnis verzehren.</p> <p>Um diesem Problem entgegenzuwirken, ha

arXiv – cs.AI 22.12.2025 05:00

Forschung

SkipKV: Effiziente KV-Kompression für große Rechenmodelle

Große Rechenmodelle für logisches Denken verbrauchen bei der Inferenz enorme Mengen an Key‑Value‑Cache, weil die ausführliche „Chain‑of‑Tho…

arXiv – cs.AI 10.12.2025 05:00

Forschung

Symbolische Solver verbessern große Sprachmodelle bei begrenztem Denken

Große Sprachmodelle (Large Reasoning Models, LRMs) erzielen beeindruckende Ergebnisse bei komplexen Logikaufgaben, indem sie lange „Chains…

arXiv – cs.AI 04.12.2025 05:00

Forschung

RP-ReAct: Mehragenten-Ansatz steigert Zuverlässigkeit autonomer Agenten in Unternehmen

Autonome Agenten haben in den letzten Jahren große Fortschritte gemacht, doch komplexe Aufgaben in Unternehmensumgebungen bleiben eine Hera…

arXiv – cs.AI 04.12.2025 05:00

Forschung

Neue Taxonomie enthüllt die „Psychologie“ großer Rechenmodelle

Wissenschaftler haben eine neue Klassifikation entwickelt, die die inneren Abläufe großer Rechenmodelle (LRMs) aus menschlicher Sicht beleu…

arXiv – cs.AI 02.12.2025 05:00

Forschung

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Große Rechenmodelle (LRMs) nutzen explizite Gedankenketten, um Antworten zu verbessern. Diese Fähigkeit birgt jedoch neue Gefahren: schädli…

arXiv – cs.AI 20.11.2025 05:00

Forschung

Pluralistische Werte im LLM-Alignment: Sicherheit, Inklusivität & Modellverhalten

In einer Zeit, in der große Sprachmodelle (LLMs) zunehmend mit menschlichem Feedback trainiert werden, um sicherer und wertorientierter zu…

arXiv – cs.AI 19.11.2025 05:00

Forschung

Neuer Ansatz: Problemlösung durch gezielte Datensynthese für große Modelle

In einer wegweisenden Veröffentlichung präsentiert ein Forschungsteam einen innovativen Ansatz zur Datensynthese, der große Rechenmodelle f…

arXiv – cs.AI 14.11.2025 05:00

Forschung

MONICA: Echtzeit-Überwachung von Sycophancy in großen Rechenmodellen

Ein neues Forschungswerkzeug namens MONICA wurde vorgestellt, das die Echtzeit-Überwachung und Kalibrierung von Sycophancy – also der Neigu…

arXiv – cs.AI 11.11.2025 05:00

Forschung

Neue Methode verhindert Selbst‑Jailbreak bei großen Rechenmodellen

Große Rechenmodelle (LRMs) zeigen beeindruckende Fähigkeiten bei komplexen Logikaufgaben, bleiben jedoch anfällig für gefährliche Inhalte u…

arXiv – cs.AI 27.10.2025 04:00

Forschung

HardcoreLogic: Benchmark prüft Logikmodelle mit seltenen Rätselvarianten

Ein neues Forschungsprojekt namens HardcoreLogic stellt große Sprachmodelle (LRMs) vor eine anspruchsvolle Herausforderung: 5.000 Logikräts…

arXiv – cs.AI 15.10.2025 05:00

Forschung

LRM-Modelle entschlüsselt: Episode-Theorie liefert Einblick in Denkprozesse

In einer wegweisenden Studie haben Forscher die Funktionsweise von Large Reasoning Models (LRMs) mithilfe der klassischen Episode-Theorie v…

arXiv – cs.AI 19.09.2025 05:00

Forschung

KI erkennt unlösbare Fragen: Methode erhöht Abstentionsrate bei großen Modellen

Die neuesten großen Rechenmodelle für komplexe Logikaufgaben haben in den letzten Jahren enorme Fortschritte erzielt. Sie lösen mathematisc…

arXiv – cs.AI 27.08.2025 05:00

Forschung

Meta‑R1: Große Rechenmodelle mit Metakognition stärken

Neues Forschungspapier aus dem arXiv‑Repository (Version 2508.17291v1) präsentiert Meta‑R1, ein generisches Framework, das große Rechenmode…

arXiv – cs.AI 26.08.2025 05:00

Finde Modelle, Firmen und Themen

Effizientes Training großer Rechenmodelle durch Progressive Thought Encoding

RFEval: Benchmark zur Messung der Glaubwürdigkeit von KI-Argumenten

Erklärbare Kompression von Gedankenketten steigert Effizienz multimodaler Modelle

GrAlgoBench enthüllt Schwächen großer Rechenmodelle bei Graphenalgorithmen

DEPO: Mit Schwierigkeitsbewertung die Kosten für Rollouts halbieren

QuantLRM: Gewichtsanpassungen als Schlüssel zur Quantisierung von LLMs

Self-Guard: Sicherheit für große Rechenmodelle durch verbesserte Selbstreflexion

EntroCut: Entropie-gesteuerte Trunkierung steigert Effizienz von Chain-of-Thought-Modellen

G-PAC und C-PAC: Neue Garantie für effiziente, bedingte Logikmodelle

Neue Methode steigert Genauigkeit großer Sprachmodelle ohne Trainingsaufwand

Neues Verfahren schützt sensible Daten in großen Rechenmodellen

GIFT: Globale Optimierung nach dem Training durch Gibbs-Initialisierung

Kreisförmiges Denken: Modelle geraten in selbstverstärkende Schleifen

SkipKV: Effiziente KV-Kompression für große Rechenmodelle

Symbolische Solver verbessern große Sprachmodelle bei begrenztem Denken

RP-ReAct: Mehragenten-Ansatz steigert Zuverlässigkeit autonomer Agenten in Unternehmen

Neue Taxonomie enthüllt die „Psychologie“ großer Rechenmodelle

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Pluralistische Werte im LLM-Alignment: Sicherheit, Inklusivität & Modellverhalten

Neuer Ansatz: Problemlösung durch gezielte Datensynthese für große Modelle

MONICA: Echtzeit-Überwachung von Sycophancy in großen Rechenmodellen

Neue Methode verhindert Selbst‑Jailbreak bei großen Rechenmodellen

HardcoreLogic: Benchmark prüft Logikmodelle mit seltenen Rätselvarianten

LRM-Modelle entschlüsselt: Episode-Theorie liefert Einblick in Denkprozesse

KI erkennt unlösbare Fragen: Methode erhöht Abstentionsrate bei großen Modellen

Meta‑R1: Große Rechenmodelle mit Metakognition stärken

🍪 Cookie-Einstellungen