Suche nach große Rechenmodelle

<p>Metakognitive Entropie-Kalibrierung verbessert verifizierbares RL-Reasoning</p> <p>In den letzten Jahren haben große Rechenmodelle für komplexe Aufgaben, wie Mathematik und Frage‑Antwort‑Systeme, enorme Fortschritte erzielt. Diese Modelle werden meist mit Reinforcement Learning und verifizierbaren Belohnungen (RLVR) trainiert. Dabei wird jedoch fast ausschließlich ein binäres Korrektheitssignal verwendet, während die inhärente Unsicherheit des Modells weitgehend ignoriert wird. Dieses „Uncertainty‑Reward

arXiv – cs.AI 27.02.2026 05:00

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert

Eine neue Studie aus dem arXiv-Repository zeigt, dass große Sprachmodelle ihre eigenen sensiblen Ausgaben selbstständig korrigieren können…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Effizientes Training großer Rechenmodelle durch Progressive Thought Encoding

Große Rechenmodelle für komplexe Aufgaben sind äußerst leistungsfähig, doch ihr Training mit Reinforcement Learning (RL) bleibt ein Engpass…

arXiv – cs.LG 20.02.2026 05:00

Forschung

<h1>Große Rechenmodelle zeigen bei Mehrfachangriffen Schwächen</h1> <p>Neuste Forschungsergebnisse zeigen, dass große Rechenmodelle, die komplexe Schlussfolgerungen ziehen können, zwar Spitzenleistungen bei anspruchsvollen Aufgaben erbringen, aber unter mehrstufiger, gezielter Angriffsbelastung nicht automatisch robust bleiben. In einer umfassenden Studie wurden neun der fortschrittlichsten Rechenmodelle auf ihre Widerstandsfähigkeit gegen gezielte Angriffe getestet.</p> <p>Die Ergebnisse sind eindeutig: Mo

arXiv – cs.AI 16.02.2026 05:00

Forschung

GrAlgoBench enthüllt Schwächen großer Rechenmodelle bei Graphenalgorithmen

Ein neues Benchmark-Set namens GrAlgoBench, veröffentlicht auf arXiv (2602.06319v1), richtet sich gezielt an große Rechenmodelle (LRMs) und…

arXiv – cs.AI 09.02.2026 05:00

Forschung

Self-Guard: Sicherheit für große Rechenmodelle durch verbesserte Selbstreflexion

Die neu auftretenden Large Reasoning Models (LRMs) eröffnen ein völlig neues Feld des expliziten Denkens und ermöglichen damit beeindrucken…

arXiv – cs.AI 03.02.2026 05:00

Forschung

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

In einer neuen Veröffentlichung auf arXiv (2601.23143v1) stellen die Autoren das Projekt ThinkSafe vor, das die Sicherheit großer Rechenmod…

arXiv – cs.AI 02.02.2026 05:00

Forschung

Effizientes, jederzeit sicheres PAC-Reasoning

Ein neues Verfahren namens B‑PAC Reasoning verspricht, große Rechenmodelle für komplexe Aufgaben effizienter zu nutzen, ohne die Genauigkei…

arXiv – cs.AI 02.02.2026 05:00

Forschung

SkipKV: Effiziente KV-Kompression für große Rechenmodelle

Große Rechenmodelle für logisches Denken verbrauchen bei der Inferenz enorme Mengen an Key‑Value‑Cache, weil die ausführliche „Chain‑of‑Tho…

arXiv – cs.AI 10.12.2025 05:00

Forschung

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Große Rechenmodelle (LRMs) nutzen explizite Gedankenketten, um Antworten zu verbessern. Diese Fähigkeit birgt jedoch neue Gefahren: schädli…

arXiv – cs.AI 20.11.2025 05:00

Forschung

Neuer Ansatz: Problemlösung durch gezielte Datensynthese für große Modelle

In einer wegweisenden Veröffentlichung präsentiert ein Forschungsteam einen innovativen Ansatz zur Datensynthese, der große Rechenmodelle f…

arXiv – cs.AI 14.11.2025 05:00

Forschung

MONICA: Echtzeit-Überwachung von Sycophancy in großen Rechenmodellen

Ein neues Forschungswerkzeug namens MONICA wurde vorgestellt, das die Echtzeit-Überwachung und Kalibrierung von Sycophancy – also der Neigu…

arXiv – cs.AI 11.11.2025 05:00

Forschung

Neue Methode verhindert Selbst‑Jailbreak bei großen Rechenmodellen

Große Rechenmodelle (LRMs) zeigen beeindruckende Fähigkeiten bei komplexen Logikaufgaben, bleiben jedoch anfällig für gefährliche Inhalte u…

arXiv – cs.AI 27.10.2025 04:00

Forschung

Meta‑R1: Große Rechenmodelle mit Metakognition stärken

Neues Forschungspapier aus dem arXiv‑Repository (Version 2508.17291v1) präsentiert Meta‑R1, ein generisches Framework, das große Rechenmode…

arXiv – cs.AI 26.08.2025 05:00

Forschung

FuSaR: Fuzzification-Methode für Sicherheit-Logik-Balance in großen Modellen

Große Rechenmodelle (LRMs) haben in den letzten Jahren beeindruckende Leistungen in vielen Aufgabenbereichen gezeigt. Ihre Fähigkeit, kompl…

arXiv – cs.AI 19.08.2025 05:00

Forschung

Neue Studie enthüllt: Große Rechenmodelle können fehlende Infos nicht anfragen

Eine aktuelle Veröffentlichung auf arXiv (2508.11252v1) untersucht die Fähigkeit von Large Reasoning Models (LRMs), fehlende Informationen…

arXiv – cs.AI 18.08.2025 05:00

Forschung

Neues Belohnungssystem reduziert Überdenken bei großen Rechenmodellen

In den letzten Jahren haben große Rechenmodelle für komplexe Denkaufgaben dank Verstärkungslernen mit überprüfbaren Belohnungen enorme Fort…

arXiv – cs.AI 15.08.2025 05:00

Forschung

Effiziente Kürzung langer Gedankengänge in großen Modellen durch Präferenzoptimierung

In den letzten Jahren haben große Rechenmodelle für logisches Denken, die sogenannten Large Reasoning Models (LRMs), beeindruckende Ergebni…

arXiv – cs.AI 15.08.2025 05:00

Finde Modelle, Firmen und Themen

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert

Effizientes Training großer Rechenmodelle durch Progressive Thought Encoding

GrAlgoBench enthüllt Schwächen großer Rechenmodelle bei Graphenalgorithmen

Self-Guard: Sicherheit für große Rechenmodelle durch verbesserte Selbstreflexion

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

Effizientes, jederzeit sicheres PAC-Reasoning

SkipKV: Effiziente KV-Kompression für große Rechenmodelle

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Neuer Ansatz: Problemlösung durch gezielte Datensynthese für große Modelle

MONICA: Echtzeit-Überwachung von Sycophancy in großen Rechenmodellen

Neue Methode verhindert Selbst‑Jailbreak bei großen Rechenmodellen

Meta‑R1: Große Rechenmodelle mit Metakognition stärken

FuSaR: Fuzzification-Methode für Sicherheit-Logik-Balance in großen Modellen

Neue Studie enthüllt: Große Rechenmodelle können fehlende Infos nicht anfragen

Neues Belohnungssystem reduziert Überdenken bei großen Rechenmodellen

Effiziente Kürzung langer Gedankengänge in großen Modellen durch Präferenzoptimierung

🍪 Cookie-Einstellungen

SemSIEdit: LLMs korrigieren sensible Infos – Lecks um 34,6 % reduziert