Suche nach Gedankenkette

RL-Feinabstimmung von VLMs: Robustheit und Konsistenz der Gedankenketten im Fokus

Reinforcement‑Learning‑Feinabstimmung (RL‑FT) hat sich bei großen Sprachmodellen als entscheidendes Verfahren zur Verbesserung von Rechenau…

arXiv – cs.LG 16.02.2026 05:00

Forschung

Erklärbare Kompression von Gedankenketten steigert Effizienz multimodaler Modelle

In multimodalen Rechenmodellen werden lange Gedankenketten (Long CoTs) eingesetzt, um komplexe Aufgaben zu lösen und dabei detaillierte vis…

arXiv – cs.AI 11.02.2026 05:00

Forschung

ESTAR: Frühzeitiges Stoppen von Token-bewusstem Denken steigert Effizienz

Ein neues Verfahren namens ESTAR (Early‑Stopping for Token‑Aware Reasoning) ermöglicht es großen Rechenmodellen, lange Gedankenketten effiz…

arXiv – cs.AI 11.02.2026 05:00

Forschung

Robustheit von Reasoning-LLMs: Wie stark sind ihre Gedankenketten gegen Störungen?<br/><p>Reasoning-LLMs erzeugen Schritt-für-Schritt-Gedankenketten, die die Leistung bei komplexen Aufgaben steigern und die Transparenz des Denkprozesses erhöhen. Doch wie widerstandsfähig sind diese Ketten, wenn sie gezielt gestört werden? Diese Frage beantwortet die neue Studie, die einen kontrollierten Evaluationsrahmen entwickelt hat, um die eigenen Gedankenketten eines Modells zu festen Zeitpunkten zu perturbieren.</p><p

arXiv – cs.AI 10.02.2026 05:00

Forschung

RLVR: Monitorierbarkeit als Gratis‑Geschenk für LRM‑Argumentationen

Mit der zunehmenden Verbreitung großer Rechenmodelle wird die Überprüfung ihrer Gedankenketten (Chain‑of‑Thought, CoT) immer wichtiger. Ein…

arXiv – cs.AI 05.02.2026 05:00

Forschung

Latent-CoT-Modelle: Schritt-für-Schritt-Rechnen im Verborgenen enthüllt

Neues Forschungsergebnis aus dem Bereich der künstlichen Intelligenz beleuchtet, wie Latent Chain-of-Thought (Latent-CoT)-Modelle tatsächli…

arXiv – cs.AI 03.02.2026 05:00

Forschung

LLMs und Mensch: Neue Ontologien für Parkinson‑Monitoring

In einer aktuellen Veröffentlichung auf arXiv wird untersucht, wie Große Sprachmodelle (LLMs) in die Entwicklung einer Ontologie für die Üb…

arXiv – cs.AI 17.12.2025 05:00

Praxis

Meta‑kognitiver KI-Agent: Dynamische Tiefensteuerung für effiziente Problemlösen

In diesem Tutorial wird ein hochentwickelter Meta‑kognitiver Kontrollagent vorgestellt, der lernt, die Tiefe seiner eigenen Denkprozesse se…

MarkTechPost 04.12.2025 05:07

Forschung

Training‑Incentives beeinflussen die Überwachbarkeit von Chain‑of‑Thought

Ein neues arXiv‑Veröffentlichung beleuchtet, wie unterschiedliche Trainingsanreize die Fähigkeit von KI‑Systemen beeinflussen, ihre Gedanke…

arXiv – cs.AI 02.12.2025 05:00

Forschung

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Große Rechenmodelle (LRMs) nutzen explizite Gedankenketten, um Antworten zu verbessern. Diese Fähigkeit birgt jedoch neue Gefahren: schädli…

arXiv – cs.AI 20.11.2025 05:00

Forschung

Output‑Überwachung kann die Gedankenkette verschleiern

Eine neue Studie von OpenAI aus dem Jahr 2025 hat gezeigt, dass das Training von Modellen gegen einen „Chain‑of‑Thought“ (CoT) Monitor dazu…

arXiv – cs.LG 18.11.2025 05:00

Forschung

MixReasoning: Dynamische Tiefensteuerung verbessert KI-Logik

Neues Forschungspapier aus dem arXiv (2510.06052v1) präsentiert MixReasoning, ein innovatives Framework, das Künstliche Intelligenz in der…

arXiv – cs.AI 08.10.2025 05:00

Forschung

LRM-Modelle entschlüsselt: Episode-Theorie liefert Einblick in Denkprozesse

In einer wegweisenden Studie haben Forscher die Funktionsweise von Large Reasoning Models (LRMs) mithilfe der klassischen Episode-Theorie v…

arXiv – cs.AI 19.09.2025 05:00

Finde Modelle, Firmen und Themen

RL-Feinabstimmung von VLMs: Robustheit und Konsistenz der Gedankenketten im Fokus

Erklärbare Kompression von Gedankenketten steigert Effizienz multimodaler Modelle

ESTAR: Frühzeitiges Stoppen von Token-bewusstem Denken steigert Effizienz

RLVR: Monitorierbarkeit als Gratis‑Geschenk für LRM‑Argumentationen

Latent-CoT-Modelle: Schritt-für-Schritt-Rechnen im Verborgenen enthüllt

LLMs und Mensch: Neue Ontologien für Parkinson‑Monitoring

Meta‑kognitiver KI-Agent: Dynamische Tiefensteuerung für effiziente Problemlösen

Training‑Incentives beeinflussen die Überwachbarkeit von Chain‑of‑Thought

SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen

Output‑Überwachung kann die Gedankenkette verschleiern

MixReasoning: Dynamische Tiefensteuerung verbessert KI-Logik

LRM-Modelle entschlüsselt: Episode-Theorie liefert Einblick in Denkprozesse

🍪 Cookie-Einstellungen