Suche nach Chain-of-Thought

Online-Lernbarkeit von Chain-of-Thought-Verifikatoren: Korrektheit vs. Vollständigkeit

Wissenschaftler haben ein neues Online-Lernframework vorgestellt, das Chain-of-Thought-Verifikatoren – Werkzeuge, die die Richtigkeit von S…

arXiv – cs.LG 05.03.2026 05:00

Forschung

Markov-Analyse enthüllt, wann Chain-of-Thought wirklich hilft

Eine neue Studie auf arXiv (2603.00306v1) beleuchtet, warum die beliebte Chain-of-Thought (CoT)-Technik bei der Verbesserung von KI‑Reasoni…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Draft-Thinking: Effizientes Lösen von langen Argumentationsketten in LLMs

Die Technik des „Long Chain‑of‑Thought“ (CoT) hat sich als führendes Verfahren zur Steigerung der Rechenleistung großer Sprachmodelle etabl…

arXiv – cs.AI 03.03.2026 05:00

Forschung

ImpRIF: Stärkeres implizites Denken verbessert komplexe Befehlsausführung

Mit der zunehmenden Komplexität von Anwendungen, die große Sprachmodelle (LLMs) einsetzen, steigt auch der Bedarf an zuverlässigen Fähigkei…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Counterfactual Simulation Training steigert Glaubwürdigkeit von Chain-of-Thought

In einer kürzlich veröffentlichten Studie auf arXiv wird ein neues Trainingsverfahren namens Counterfactual Simulation Training (CST) vorge…

arXiv – cs.AI 25.02.2026 05:00

Forschung

LLMs: Zu viel Rechenleistung kann Denken bremsen – neue Halo-Lösung

In einer aktuellen Studie auf arXiv wird gezeigt, dass die beliebte Chain-of-Thought-Strategie, die große Sprachmodelle bei komplexen Aufga…

arXiv – cs.AI 24.02.2026 05:00

Praxis

ByteDance revolutioniert KI-Logik: Molekulare Bindungen stabilisieren Langzeit‑Denken

ByteDance Seed hat kürzlich eine bahnbrechende Studie veröffentlicht, die die Art und Weise, wie wir KI‑Logik entwickeln, verändern könnte…

MarkTechPost 22.02.2026 20:54

Forschung

<h1>CoT-Distillation: Curriculum Learning mit strukturiertem Maskieren & GRPO</h1> Die Übertragung von Chain‑of‑Thought‑(CoT)‑Logik aus großen Sprachmodellen in kompakte Nachschreibermodelle stellt ein zentrales Problem dar: die ausführlichen Begründungen der Lehrermodelle sind für kleinere Modelle oft zu umfangreich, um sie exakt zu replizieren. Traditionelle Ansätze reduzieren die Logik auf einen einzigen Schritt, wodurch die wertvolle Interpretierbarkeit verloren geht. In der neuen Studie wird

arXiv – cs.AI 23.02.2026 05:00

Forschung

On-Policy SFT: Effiziente, präzise KI-Logik ohne komplexes RL

In der Forschung zu großen Rechenmodellen für logisches Denken wird häufig Reinforcement Learning (RL) eingesetzt, um lange „Chain-of-Thoug…

arXiv – cs.AI 17.02.2026 05:00

Forschung

RL-Feinabstimmung von VLMs: Robustheit und Konsistenz der Gedankenketten im Fokus

Reinforcement‑Learning‑Feinabstimmung (RL‑FT) hat sich bei großen Sprachmodellen als entscheidendes Verfahren zur Verbesserung von Rechenau…

arXiv – cs.LG 16.02.2026 05:00

Forschung

Effizientes Chain-of-Thought: Constraint-Rectified Training reduziert Tokenverbrauch

Die neueste Forschung im Bereich der großen Sprachmodelle (LLMs) präsentiert einen innovativen Ansatz, um die Vorteile des Chain-of-Thought…

arXiv – cs.LG 16.02.2026 05:00

Forschung

Neues Modell korrigiert ASR-Fehler bei Namen mit adaptiver Chain-of-Thought

End-to-End-Spracherkennungssysteme haben oft Probleme, domänenspezifische Begriffe wie Namen korrekt zu erkennen. Ein neues, auf großen Spr…

arXiv – cs.AI 16.02.2026 05:00

Forschung

PASCAL: Neuer Scheduling-Algorithmus verkürzt TTFT bei Chain-of-Thought-LLMs um 72 %

In einer kürzlich veröffentlichten Arbeit auf arXiv präsentiert das Forschungsteam den Algorithmus PASCAL, der die Ausführung von reasoning…

arXiv – cs.LG 13.02.2026 05:00

Forschung

Stärkung des Chain-of-Thought-Reasonings durch selbstentwickelnde Rubriken

Chain-of-Thought (CoT) ist ein entscheidender Bestandteil der Argumentationsfähigkeit großer Sprachmodelle, doch die direkte Belohnung dies…

arXiv – cs.AI 12.02.2026 05:00

Forschung

Joint Reward Modeling: Effiziente Bild-Reward-Modelle durch gemeinsames Lernen Reward‑Modelle sind das Herzstück von Reinforcement‑Learning‑From‑Human‑Feedback (RLHF). Sie bestimmen, wie gut generative Modelle menschliche Präferenzen widerspiegeln und gleichzeitig zuverlässig bleiben. Besonders bei komplexen Bild‑Bearbeitungsaufgaben muss ein Reward‑Modell globale semantische Konsistenz und implizite logische Einschränkungen erfassen – weit über die reine lokale Ähnlichkeit hinaus. Aktuelle

arXiv – cs.AI 10.02.2026 05:00

Forschung

Robustheit von Reasoning-LLMs: Wie stark sind ihre Gedankenketten gegen Störungen? Reasoning-LLMs erzeugen Schritt-für-Schritt-Gedankenketten, die die Leistung bei komplexen Aufgaben steigern und die Transparenz des Denkprozesses erhöhen. Doch wie widerstandsfähig sind diese Ketten, wenn sie gezielt gestört werden? Diese Frage beantwortet die neue Studie, die einen kontrollierten Evaluationsrahmen entwickelt hat, um die eigenen Gedankenketten eines Modells zu festen Zeitpunkten zu perturbieren.<p

arXiv – cs.AI 10.02.2026 05:00

Forschung

Neue Methode steigert LLMs beim mathematischen Problemlösen

Die Fähigkeit von Sprachmodellen, mathematische Aufgaben zu lösen, gilt als entscheidender Test für ihre Denkfähigkeit und ist für Anwendun…

arXiv – cs.AI 05.02.2026 05:00

Praxis

Effiziente Agenten-Logik: Mehrere Denkpfade dynamisch kürzen ohne Genauigkeitsverlust

In einem neuen Tutorial wird ein innovatives Framework vorgestellt, das Agenten-Logik effizienter gestaltet, indem mehrere Denkpfade gleich…

MarkTechPost 04.02.2026 23:23

Forschung

Modal‑Mixed Chain‑of‑Thought: Neue multimodale Denkweise mit latenten Embeddings

In einer neuen Studie wird die Chain‑of‑Thought‑Methode (CoT) über reine Textschritte hinaus erweitert, um multimodale Probleme besser zu l…

arXiv – cs.AI 03.02.2026 05:00

Forschung

Robuste KI-Logik: GASP stärkt Modelle gegen fehlerhafte Eingaben

In der Welt des Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) sind Modelle oft beeindruckend stark, doch ihre Leistung kann…

arXiv – cs.LG 03.02.2026 05:00

Forschung

Latent-CoT-Modelle: Schritt-für-Schritt-Rechnen im Verborgenen enthüllt

Neues Forschungsergebnis aus dem Bereich der künstlichen Intelligenz beleuchtet, wie Latent Chain-of-Thought (Latent-CoT)-Modelle tatsächli…

arXiv – cs.AI 03.02.2026 05:00

Forschung

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

In einer neuen Veröffentlichung auf arXiv (2601.23143v1) stellen die Autoren das Projekt ThinkSafe vor, das die Sicherheit großer Rechenmod…

arXiv – cs.AI 02.02.2026 05:00

Forschung

SCALAR-Benchmark prüft Halluzinationen und Konsistenz in Material-ML-Modellen

Wissenschaftler haben ein neues Benchmark namens SCALAR entwickelt, das die Leistungsfähigkeit von Sprachmodellen in der Materialwissenscha…

arXiv – cs.LG 02.02.2026 05:00

Forschung

CoT-Obfuskation kann unerwartete Aufgaben übernehmen

Eine neue Studie aus dem arXiv-Repository zeigt, dass die Verdeckung von Chain‑of‑Thought‑Erklärungen – also die Art und Weise, wie große S…

arXiv – cs.AI 02.02.2026 05:00

Forschung

EntroCut: Entropie-gesteuerte Trunkierung steigert Effizienz von Chain-of-Thought-Modellen

Ein neues Verfahren namens EntroCut verspricht, die Rechenkosten von Large Reasoning Models (LRMs) drastisch zu senken, ohne dabei die Gena…

arXiv – cs.AI 02.02.2026 05:00

Forschung

Latente Chain-of-Thought als Planung: Trennung von Denken und Ausdruck

Ein neues Verfahren namens PLaT (Planning with Latent Thoughts) präsentiert eine innovative Herangehensweise an die latente Chain-of-Though…

arXiv – cs.AI 30.01.2026 05:00

Forschung

CtrlCoT: Dual‑Granularität für effiziente Chain‑of‑Thought‑Kompression

Ein neues Verfahren namens CtrlCoT wurde vorgestellt, das die lange und kostenintensive Chain‑of‑Thought (CoT) – ein Verfahren, bei dem gro…

arXiv – cs.AI 29.01.2026 05:00

Forschung

Gaming the Judge: LLM-Judges können durch manipulierte Chain-of-Thought täuschen – Forschung warnt

In einer wegweisenden Studie von Forschern auf arXiv wird deutlich, dass große Sprachmodelle (LLMs), die als „Judges“ zur Bewertung von Age…

arXiv – cs.AI 22.01.2026 05:00

Forschung

KI-Modelle meistern mathematische Rätsel dank neuer „Trap‑Aware“ Technik

Wissenschaftler haben eine neue Methode entwickelt, die große Sprachmodelle dabei unterstützt, komplexe mathematische Aufgaben korrekt zu l…

arXiv – cs.AI 21.01.2026 05:00

Forschung

Neues Verfahren steigert logisches Denken von Sprachmodellen

Moderne Sprachmodelle nutzen häufig aufwändige interaktive Rahmenwerke, um logische Aufgaben zu lösen. Diese Ansätze erfordern oft zusätzli…

arXiv – cs.AI 16.01.2026 05:00

Finde Modelle, Firmen und Themen

Online-Lernbarkeit von Chain-of-Thought-Verifikatoren: Korrektheit vs. Vollständigkeit

Markov-Analyse enthüllt, wann Chain-of-Thought wirklich hilft

Draft-Thinking: Effizientes Lösen von langen Argumentationsketten in LLMs

ImpRIF: Stärkeres implizites Denken verbessert komplexe Befehlsausführung

Counterfactual Simulation Training steigert Glaubwürdigkeit von Chain-of-Thought

LLMs: Zu viel Rechenleistung kann Denken bremsen – neue Halo-Lösung

ByteDance revolutioniert KI-Logik: Molekulare Bindungen stabilisieren Langzeit‑Denken

On-Policy SFT: Effiziente, präzise KI-Logik ohne komplexes RL

RL-Feinabstimmung von VLMs: Robustheit und Konsistenz der Gedankenketten im Fokus

Effizientes Chain-of-Thought: Constraint-Rectified Training reduziert Tokenverbrauch

Neues Modell korrigiert ASR-Fehler bei Namen mit adaptiver Chain-of-Thought

PASCAL: Neuer Scheduling-Algorithmus verkürzt TTFT bei Chain-of-Thought-LLMs um 72 %

Stärkung des Chain-of-Thought-Reasonings durch selbstentwickelnde Rubriken

Neue Methode steigert LLMs beim mathematischen Problemlösen

Effiziente Agenten-Logik: Mehrere Denkpfade dynamisch kürzen ohne Genauigkeitsverlust

Modal‑Mixed Chain‑of‑Thought: Neue multimodale Denkweise mit latenten Embeddings

Robuste KI-Logik: GASP stärkt Modelle gegen fehlerhafte Eingaben

Latent-CoT-Modelle: Schritt-für-Schritt-Rechnen im Verborgenen enthüllt

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

SCALAR-Benchmark prüft Halluzinationen und Konsistenz in Material-ML-Modellen

CoT-Obfuskation kann unerwartete Aufgaben übernehmen

EntroCut: Entropie-gesteuerte Trunkierung steigert Effizienz von Chain-of-Thought-Modellen

Latente Chain-of-Thought als Planung: Trennung von Denken und Ausdruck

CtrlCoT: Dual‑Granularität für effiziente Chain‑of‑Thought‑Kompression

Gaming the Judge: LLM-Judges können durch manipulierte Chain-of-Thought täuschen – Forschung warnt

KI-Modelle meistern mathematische Rätsel dank neuer „Trap‑Aware“ Technik

Neues Verfahren steigert logisches Denken von Sprachmodellen

🍪 Cookie-Einstellungen

PASCAL: Neuer Scheduling-Algorithmus verkürzt TTFT bei Chain-of-Thought-LLMs um 72 %