Suche nach Argumentationsketten

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Reinforcement‑Learning‑Modelle, die auf Group Relative Policy Optimization (GRPO) setzen, haben sich als effektive Methode etabliert, um di…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Draft-Thinking: Effizientes Lösen von langen Argumentationsketten in LLMs

Die Technik des „Long Chain‑of‑Thought“ (CoT) hat sich als führendes Verfahren zur Steigerung der Rechenleistung großer Sprachmodelle etabl…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Counterfactual Simulation Training steigert Glaubwürdigkeit von Chain-of-Thought

In einer kürzlich veröffentlichten Studie auf arXiv wird ein neues Trainingsverfahren namens Counterfactual Simulation Training (CST) vorge…

arXiv – cs.AI 25.02.2026 05:00

Forschung

DRTC: Erkennung kritischer Entscheidungsstellen in Sprachmodell-Logik

Die Frage, wie Sprachmodelle lange, komplexe Argumentationsketten aufbauen, bleibt ein zentrales Forschungsproblem. Bisherige Erklärungsans…

arXiv – cs.LG 18.02.2026 05:00

Forschung

KI lernt kontinuierlich, wie sie denken soll – neues Lernmodell

In einem bahnbrechenden Beitrag aus dem arXiv‑Repository wird ein neues Lernframework vorgestellt, das KI-Systeme befähigt, ihre eigenen De…

arXiv – cs.AI 13.02.2026 05:00

Forschung

LLMs erreichen bei langen Aufgaben inhärente Stabilitätsgrenze – Theorie erklärt

Große Sprachmodelle (LLMs) zeigen beeindruckende Rechenfähigkeiten, doch bei Aufgaben, die viele Zwischenschritte erfordern, treten plötzli…

arXiv – cs.AI 09.02.2026 05:00

Forschung

ProAct: Agenten mit präziser Vorhersage meistern komplexe Interaktionen

Das neue ProAct‑Framework löst ein langjähriges Problem von Large‑Language‑Model‑Agenten: die Schwierigkeit, in interaktiven Umgebungen lan…

arXiv – cs.AI 06.02.2026 05:00

Forschung

Ressourcenschonende Verstärkung für LLMs: One-Shot-Policy-Optimierung

Große Sprachmodelle (LLMs) haben bei komplexen Denkaufgaben beeindruckende Ergebnisse erzielt. Ein vielversprechender Ansatz zur Ausrichtun…

arXiv – cs.AI 03.02.2026 05:00

Forschung

Visuelle Generierung stärkt menschlich Denken in multimodalen Modellen

In einer neuen Studie von arXiv:2601.19834v1 wird gezeigt, wie visuelle Inhalte die Art und Weise verbessern, wie KI‑Systeme über die reale…

arXiv – cs.AI 28.01.2026 05:00

Forschung

Neues Geometric Reasoner verbessert Langkettige Logik ohne Trainingsaufwand

Ein völlig neues, trainingsfreies Framework namens Geometric Reasoner (TGR) hat die Art und Weise, wie große Sprachmodelle lange Argumentat…

arXiv – cs.AI 28.01.2026 05:00

Forschung

SCOPE: Effiziente, robuste Mehrbedingungsplanung mit KI-Code-Engine

Die Planung von Aufgaben, die mehreren, oft widersprüchlichen Vorgaben genügen müssen, stellt aktuelle KI-Modelle vor große Herausforderung…

arXiv – cs.AI 15.01.2026 05:00

Forschung

STEP: Schrittweise Bewertung von Traces senkt LLM‑Latenz um bis zu 70 %

Große Sprachmodelle (LLMs) können ihre Denkfähigkeiten durch Test‑Time‑Scaling verbessern, indem sie mehrere Rechenpfade erzeugen. Doch die…

arXiv – cs.LG 15.01.2026 05:00

Forschung

<h1>MLLMs mit Bild-Tools: Ophiuchus verbessert medizinische Bildanalyse</h1> <p>In der medizinischen Bildanalyse haben sich multimodale Large Language Models (MLLMs) bereits durch die Fähigkeit, schrittweise textuelle Argumentationsketten zu erzeugen, hervorgetan. Dennoch bleiben komplexe Aufgaben, die ein dynamisches und iteratives Fokussieren auf feine Bildregionen erfordern, eine Herausforderung. Mit dem neuen Framework <strong>Ophiuchus</strong> wird dieses Problem angegangen.</p> <p>Ophiuchus erweitert

arXiv – cs.AI 17.12.2025 05:00

Forschung

Context-Picker: Dynamische Kontextauswahl mit mehrstufigem Reinforcement Learning

In der langen Kontextfragebeantwortung (Long‑Context QA) stellt die Wahl des optimalen Kontextumfangs ein zentrales Problem dar. Zu wenige…

arXiv – cs.AI 17.12.2025 05:00

Forschung

Ethik in KI: Ontologische Kontextschicht für transparente Agentenentscheidungen

Ein neues Preprint auf arXiv (2512.04822v1) präsentiert einen kollaborativen Ansatz, bei dem Menschen und KI gemeinsam eine überprüfbare se…

arXiv – cs.AI 05.12.2025 05:00

Forschung

Künstliche Fehler einbauen reicht nicht: Selbstkorrektur bleibt aus

Reinforcement Learning (RL) gilt als das führende Verfahren, um große Sprachmodelle zum eigenständigen Nachdenken und Korrigieren ihrer Feh…

arXiv – cs.AI 03.12.2025 05:00

Forschung

Hermes: LLMs kombinieren informelle und formale Mathematik, höhere Genauigkeit

In der Welt der großen Sprachmodelle (LLMs) hat informelle Mathematik lange Zeit die Flexibilität und Effizienz bei der Argumentationsbildu…

arXiv – cs.AI 25.11.2025 05:00

Forschung

Neue Aufgabe ARCHE prüft, ob KI echte wissenschaftliche Argumente versteht

Wissenschaftler haben eine neue Herausforderung für große Sprachmodelle (LLMs) entwickelt, die die Tiefe des logischen Denkens in wissensch…

arXiv – cs.AI 18.11.2025 05:00

Forschung

MarsRL: Mehr-Agenten-Logik mit Reinforcement Learning steigert LLM-Performance

Die jüngsten Durchbrüche bei großen Sprachmodellen (LLMs) wurden maßgeblich durch Reinforcement Learning mit verifizierbaren Belohnungen (R…

arXiv – cs.AI 17.11.2025 05:00

Forschung

Vertrauensbasierte Belohnungsmodellierung verbessert das logische Denken von LLMs

In den letzten Jahren hat sich die Forschung zu großen Sprachmodellen (LLMs) von klassischen Anweisungsanpassungen hin zu Reinforcement‑Lea…

arXiv – cs.AI 12.11.2025 05:00

Forschung

Neuer Spectral‑Kill‑Switch verhindert Fehler in Sprachagenten vor Auftreten

Ein brandneues Verfahren schützt Sprachagenten vor fehlerhaften Zwischenschritten, bevor diese bereits in die endgültige Antwort einfließen…

arXiv – cs.LG 11.11.2025 05:00

Forschung

Neues Messverfahren verbessert Übereinstimmung von KI- und menschlicher Argumentation

Ein kürzlich auf arXiv veröffentlichtes Forschungsdokument stellt ein innovatives Verfahren vor, mit dem die Konsistenz von Sprachmodellen…

arXiv – cs.AI 11.11.2025 05:00

Forschung

KI lernt, Rechenaufwand für Antworten dynamisch anzupassen

Eine neue Methode namens Adaptive Effort Control ermöglicht es KI-Modellen, den Denkaufwand für jede Anfrage exakt an die jeweilige Schwier…

arXiv – cs.AI 03.11.2025 05:00

Forschung

LLM‑Logik überprüft: Rang der Korrelation liefert zuverlässige Fehlererkennung

Eine neue Studie aus dem arXiv‑Repository zeigt, dass die interne Logik großer Sprachmodelle (LLMs) bereits aussagekräftige Hinweise auf di…

arXiv – cs.AI 29.10.2025 04:00

Forschung

KI-Agenten: Universelle Problemlöser – Neue Forschungsergebnisse

Eine aktuelle Veröffentlichung auf arXiv präsentiert KI‑Agenten, die bereits in der Lage sind, eine Vielzahl von Aufgaben zu lösen, indem s…

arXiv – cs.AI 15.10.2025 05:00

Forschung

MixReasoning: Dynamische Tiefensteuerung verbessert KI-Logik

Neues Forschungspapier aus dem arXiv (2510.06052v1) präsentiert MixReasoning, ein innovatives Framework, das Künstliche Intelligenz in der…

arXiv – cs.AI 08.10.2025 05:00

Forschung

Verifizierbare Composite Rewards reduzieren Reward Hacking bei LLMs

Neue Forschung aus dem arXiv-Preprint RLVR: Reinforcement Learning from Verifiable Rewards zeigt, dass große Sprachmodelle (LLMs) eigenstän…

arXiv – cs.LG 22.09.2025 05:00

Forschung

GLARE: Agentisches Rechtssystem verbessert juristische Urteilsprognosen

Ein neues arXiv‑Veröffentlichung mit der Kennung 2508.16383v1 präsentiert GLARE, ein innovatives Framework zur Vorhersage juristischer Urte…

arXiv – cs.AI 25.08.2025 05:00

Forschung

AIRL‑S vereint RL und Such‑basierte TTS – neue Methode verbessert Leistung um 9 %

Die Optimierung von Test‑Time‑Scaling‑Modellen (TTS) für große Sprachmodelle (LLMs) hat sich bislang in zwei stark getrennte Ansätze aufges…

arXiv – cs.LG 21.08.2025 05:00

Finde Modelle, Firmen und Themen

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Draft-Thinking: Effizientes Lösen von langen Argumentationsketten in LLMs

Counterfactual Simulation Training steigert Glaubwürdigkeit von Chain-of-Thought

DRTC: Erkennung kritischer Entscheidungsstellen in Sprachmodell-Logik

KI lernt kontinuierlich, wie sie denken soll – neues Lernmodell

LLMs erreichen bei langen Aufgaben inhärente Stabilitätsgrenze – Theorie erklärt

ProAct: Agenten mit präziser Vorhersage meistern komplexe Interaktionen

Ressourcenschonende Verstärkung für LLMs: One-Shot-Policy-Optimierung

Visuelle Generierung stärkt menschlich Denken in multimodalen Modellen

Neues Geometric Reasoner verbessert Langkettige Logik ohne Trainingsaufwand

SCOPE: Effiziente, robuste Mehrbedingungsplanung mit KI-Code-Engine

STEP: Schrittweise Bewertung von Traces senkt LLM‑Latenz um bis zu 70 %

Context-Picker: Dynamische Kontextauswahl mit mehrstufigem Reinforcement Learning

Ethik in KI: Ontologische Kontextschicht für transparente Agentenentscheidungen

Künstliche Fehler einbauen reicht nicht: Selbstkorrektur bleibt aus

Hermes: LLMs kombinieren informelle und formale Mathematik, höhere Genauigkeit

Neue Aufgabe ARCHE prüft, ob KI echte wissenschaftliche Argumente versteht

MarsRL: Mehr-Agenten-Logik mit Reinforcement Learning steigert LLM-Performance

Vertrauensbasierte Belohnungsmodellierung verbessert das logische Denken von LLMs

Neuer Spectral‑Kill‑Switch verhindert Fehler in Sprachagenten vor Auftreten

Neues Messverfahren verbessert Übereinstimmung von KI- und menschlicher Argumentation

KI lernt, Rechenaufwand für Antworten dynamisch anzupassen

LLM‑Logik überprüft: Rang der Korrelation liefert zuverlässige Fehlererkennung

KI-Agenten: Universelle Problemlöser – Neue Forschungsergebnisse

MixReasoning: Dynamische Tiefensteuerung verbessert KI-Logik

Verifizierbare Composite Rewards reduzieren Reward Hacking bei LLMs

GLARE: Agentisches Rechtssystem verbessert juristische Urteilsprognosen

AIRL‑S vereint RL und Such‑basierte TTS – neue Methode verbessert Leistung um 9 %

🍪 Cookie-Einstellungen

STEP: Schrittweise Bewertung von Traces senkt LLM‑Latenz um bis zu 70 %

AIRL‑S vereint RL und Such‑basierte TTS – neue Methode verbessert Leistung um 9 %