Suche nach LRM | meineki.news

Effizientes Training großer Rechenmodelle durch Progressive Thought Encoding

Große Rechenmodelle für komplexe Aufgaben sind äußerst leistungsfähig, doch ihr Training mit Reinforcement Learning (RL) bleibt ein Engpass…

arXiv – cs.LG 20.02.2026 05:00

Forschung

LinkedIn setzt CADET ein: Transformer ohne Decoder für präzise CTR‑Vorhersagen

LinkedIn hat ein neues Modell namens CADET (Context‑Conditioned Ads Decoder‑Only Transformer) vorgestellt, das die Vorhersage der Klickrate…

arXiv – cs.LG 13.02.2026 05:00

Forschung

Große Sprachmodelle zeigen Schwächen bei Theory of Mind-Aufgaben Eine aktuelle Untersuchung aus dem arXiv‑Repository analysiert, ob die jüngsten Fortschritte bei Großen Rechenmodellen (LRMs) – die für Schritt‑für‑Schritt‑Rechnungen in Mathematik und Programmierung glänzen – auch auf sozialkognitive Fähigkeiten übertragen werden können. Dabei wurden neun hochentwickelte Große Sprachmodelle (LLMs) systematisch auf drei repräsentativen Theory of Mind (ToM)-Benchmarks getestet, wobei Modelle mit expliziter Re

arXiv – cs.AI 12.02.2026 05:00

Forschung

GrAlgoBench enthüllt Schwächen großer Rechenmodelle bei Graphenalgorithmen

Ein neues Benchmark-Set namens GrAlgoBench, veröffentlicht auf arXiv (2602.06319v1), richtet sich gezielt an große Rechenmodelle (LRMs) und…

arXiv – cs.AI 09.02.2026 05:00

Forschung

DEPO: Mit Schwierigkeitsbewertung die Kosten für Rollouts halbieren

Ein neues arXiv-Papier präsentiert DEPO, ein innovatives Verfahren zur Optimierung von Large Reasoning Models (LRMs). Durch die Einführung…

arXiv – cs.AI 09.02.2026 05:00

Forschung

RLVR: Monitorierbarkeit als Gratis‑Geschenk für LRM‑Argumentationen

Mit der zunehmenden Verbreitung großer Rechenmodelle wird die Überprüfung ihrer Gedankenketten (Chain‑of‑Thought, CoT) immer wichtiger. Ein…

arXiv – cs.AI 05.02.2026 05:00

Forschung

QuantLRM: Gewichtsanpassungen als Schlüssel zur Quantisierung von LLMs

In der Welt der großen Sprachmodelle (LLMs) gewinnt die Gewichtsanpassung bei der Quantisierung zunehmend an Bedeutung. Forscher haben eine…

arXiv – cs.LG 04.02.2026 05:00

Forschung

Self-Guard: Sicherheit für große Rechenmodelle durch verbesserte Selbstreflexion

Die neu auftretenden Large Reasoning Models (LRMs) eröffnen ein völlig neues Feld des expliziten Denkens und ermöglichen damit beeindrucken…

arXiv – cs.AI 03.02.2026 05:00

Forschung

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

In einer neuen Veröffentlichung auf arXiv (2601.23143v1) stellen die Autoren das Projekt ThinkSafe vor, das die Sicherheit großer Rechenmod…

arXiv – cs.AI 02.02.2026 05:00

Forschung

EntroCut: Entropie-gesteuerte Trunkierung steigert Effizienz von Chain-of-Thought-Modellen

Ein neues Verfahren namens EntroCut verspricht, die Rechenkosten von Large Reasoning Models (LRMs) drastisch zu senken, ohne dabei die Gena…

arXiv – cs.AI 02.02.2026 05:00

Forschung

CoScale‑RL: Effizientes Post‑Training Skalieren von Daten und Rechenleistung

Ein neues Verfahren namens CoScale‑RL verspricht, die Nachschulung großer Rechenmodelle deutlich effizienter zu gestalten. Durch eine innov…

arXiv – cs.LG 22.01.2026 05:00

Forschung

Interaktive Testzeit-Intervention verbessert Deep Reasoning effizient

Große Denkmodelle (LRMs) sind in der Lage, komplexe Mehrschritt‑Aufgaben zu lösen, leiden jedoch häufig unter ineffizienten Denkprozessen w…

arXiv – cs.AI 19.01.2026 05:00

Forschung

<h1>LLMs gegen Halluzinationen: Ein neuer Rahmen für Zuverlässigkeit</h1> <p>Large Language Models (LLMs) und Large Reasoning Models (LRMs) versprechen enorme Fortschritte in Bereichen wie Finanzen und Recht. Doch ihre Neigung, falsche oder unbestätigte Inhalte zu erzeugen – sogenannte Halluzinationen – stellt ein ernstes Vertrauensproblem dar.</p> <p>In einer neuen Studie wird ein umfassendes operatives Rahmenwerk vorgestellt, das Halluzinationen systematisch erkennt und mindert. Der Ansatz basiert auf ein

arXiv – cs.AI 16.01.2026 05:00

Forschung

Neues Verfahren schützt sensible Daten in großen Rechenmodellen

Die Forschung im Bereich der großen Rechenmodelle (LRMs) hat einen bedeutenden Fortschritt erzielt: Mit dem neuen Ansatz „Sensitive Traject…

arXiv – cs.AI 15.01.2026 05:00

Forschung

GIFT: Globale Optimierung nach dem Training durch Gibbs-Initialisierung

Ein neues Verfahren namens GIFT (Gibbs Initialization with Finite Temperature) verspricht, die Leistung von Large Reasoning Models (LRMs) n…

arXiv – cs.LG 15.01.2026 05:00

Forschung

Neue „Laws of Reasoning“ bringen Klarheit in KI‑Logik

Ein neues arXiv‑Veröffentlichung mit der Bezeichnung 2512.17901v1 präsentiert ein einheitliches Rahmenwerk namens „Laws of Reasoning“ (LoRe…

arXiv – cs.AI 22.12.2025 05:00

Forschung

Fose: Schnelle Bildfusion mit One‑Step‑Diffusion und End‑to‑End‑Netzwerk

Die Pansharpening‑Aufgabe, bei der hochauflösende multispektrale Bilder aus einer Kombination von Niedrigauflösenden Multispektralbildern (…

arXiv – cs.AI 22.12.2025 05:00

Forschung

Symbolische Solver verbessern große Sprachmodelle bei begrenztem Denken

Große Sprachmodelle (Large Reasoning Models, LRMs) erzielen beeindruckende Ergebnisse bei komplexen Logikaufgaben, indem sie lange „Chains…

arXiv – cs.AI 04.12.2025 05:00

Forschung

Neue Taxonomie enthüllt die „Psychologie“ großer Rechenmodelle

Wissenschaftler haben eine neue Klassifikation entwickelt, die die inneren Abläufe großer Rechenmodelle (LRMs) aus menschlicher Sicht beleu…

arXiv – cs.AI 02.12.2025 05:00

Forschung

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Große Rechenmodelle (LRMs) nutzen explizite Gedankenketten, um Antworten zu verbessern. Diese Fähigkeit birgt jedoch neue Gefahren: schädli…

arXiv – cs.AI 20.11.2025 05:00

Forschung

Pluralistische Werte im LLM-Alignment: Sicherheit, Inklusivität & Modellverhalten

In einer Zeit, in der große Sprachmodelle (LLMs) zunehmend mit menschlichem Feedback trainiert werden, um sicherer und wertorientierter zu…

arXiv – cs.AI 19.11.2025 05:00

Forschung

Neue Belohnungsmodelle reduzieren Überdenken bei Sprachmodellen

Reinforcement‑Learning‑With‑Verifiable‑Rewards (RLVR) hat gezeigt, dass große Sprachmodelle (LLMs) ihre Fähigkeit zum logischen Denken deut…

arXiv – cs.AI 13.11.2025 05:00

Forschung

MONICA: Echtzeit-Überwachung von Sycophancy in großen Rechenmodellen

Ein neues Forschungswerkzeug namens MONICA wurde vorgestellt, das die Echtzeit-Überwachung und Kalibrierung von Sycophancy – also der Neigu…

arXiv – cs.AI 11.11.2025 05:00

Forschung

Neue Methode verhindert Selbst‑Jailbreak bei großen Rechenmodellen

Große Rechenmodelle (LRMs) zeigen beeindruckende Fähigkeiten bei komplexen Logikaufgaben, bleiben jedoch anfällig für gefährliche Inhalte u…

arXiv – cs.AI 27.10.2025 04:00

Forschung

ThinkPilot: Automatisierte Optimierung von Reasoning-Modellen mit Think-Prefixes

Ein neues, trainingsfreies Framework namens ThinkPilot verspricht, die Leistungsfähigkeit großer Reasoning-Modelle (LRMs) deutlich zu steig…

arXiv – cs.AI 15.10.2025 05:00

Forschung

HardcoreLogic: Benchmark prüft Logikmodelle mit seltenen Rätselvarianten

Ein neues Forschungsprojekt namens HardcoreLogic stellt große Sprachmodelle (LRMs) vor eine anspruchsvolle Herausforderung: 5.000 Logikräts…

arXiv – cs.AI 15.10.2025 05:00

Forschung

LRM-Modelle entschlüsselt: Episode-Theorie liefert Einblick in Denkprozesse

In einer wegweisenden Studie haben Forscher die Funktionsweise von Large Reasoning Models (LRMs) mithilfe der klassischen Episode-Theorie v…

arXiv – cs.AI 19.09.2025 05:00

Forschung

Metakognition steigert Sprachmodelle: Sie übertreffen spezialisierte Logikmodelle

Große Sprachmodelle (LLMs) sind schnell und flexibel, doch bei strenger Logik oder Einschränkungen stoßen sie oft an ihre Grenzen. Speziali…

arXiv – cs.AI 26.08.2025 05:00

Forschung

Meta‑R1: Große Rechenmodelle mit Metakognition stärken

Neues Forschungspapier aus dem arXiv‑Repository (Version 2508.17291v1) präsentiert Meta‑R1, ein generisches Framework, das große Rechenmode…

arXiv – cs.AI 26.08.2025 05:00

Forschung

FuSaR: Fuzzification-Methode für Sicherheit-Logik-Balance in großen Modellen

Große Rechenmodelle (LRMs) haben in den letzten Jahren beeindruckende Leistungen in vielen Aufgabenbereichen gezeigt. Ihre Fähigkeit, kompl…

arXiv – cs.AI 19.08.2025 05:00

Finde Modelle, Firmen und Themen

Effizientes Training großer Rechenmodelle durch Progressive Thought Encoding

LinkedIn setzt CADET ein: Transformer ohne Decoder für präzise CTR‑Vorhersagen

GrAlgoBench enthüllt Schwächen großer Rechenmodelle bei Graphenalgorithmen

DEPO: Mit Schwierigkeitsbewertung die Kosten für Rollouts halbieren

RLVR: Monitorierbarkeit als Gratis‑Geschenk für LRM‑Argumentationen

QuantLRM: Gewichtsanpassungen als Schlüssel zur Quantisierung von LLMs

Self-Guard: Sicherheit für große Rechenmodelle durch verbesserte Selbstreflexion

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

EntroCut: Entropie-gesteuerte Trunkierung steigert Effizienz von Chain-of-Thought-Modellen

CoScale‑RL: Effizientes Post‑Training Skalieren von Daten und Rechenleistung

Interaktive Testzeit-Intervention verbessert Deep Reasoning effizient

Neues Verfahren schützt sensible Daten in großen Rechenmodellen

GIFT: Globale Optimierung nach dem Training durch Gibbs-Initialisierung

Neue „Laws of Reasoning“ bringen Klarheit in KI‑Logik

Fose: Schnelle Bildfusion mit One‑Step‑Diffusion und End‑to‑End‑Netzwerk

Symbolische Solver verbessern große Sprachmodelle bei begrenztem Denken

Neue Taxonomie enthüllt die „Psychologie“ großer Rechenmodelle

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Pluralistische Werte im LLM-Alignment: Sicherheit, Inklusivität & Modellverhalten

Neue Belohnungsmodelle reduzieren Überdenken bei Sprachmodellen

MONICA: Echtzeit-Überwachung von Sycophancy in großen Rechenmodellen

Neue Methode verhindert Selbst‑Jailbreak bei großen Rechenmodellen

ThinkPilot: Automatisierte Optimierung von Reasoning-Modellen mit Think-Prefixes

HardcoreLogic: Benchmark prüft Logikmodelle mit seltenen Rätselvarianten

LRM-Modelle entschlüsselt: Episode-Theorie liefert Einblick in Denkprozesse

Metakognition steigert Sprachmodelle: Sie übertreffen spezialisierte Logikmodelle

Meta‑R1: Große Rechenmodelle mit Metakognition stärken

FuSaR: Fuzzification-Methode für Sicherheit-Logik-Balance in großen Modellen

🍪 Cookie-Einstellungen