KI News: Kurz und klar.

Anmelden

Illusions of reflection: open-ended task reveals systematic failures in Large Language Models' reflective reasoning

arXiv – cs.AI • 22.10.2025 05:00 • Original

#große Sprachmodelle #Reflexion #Selbstkorrektur #Offene Aufgaben #Regelkonformität #Wissenschaftliche Testitems #Fehlererkennung

Anzeige

Ähnliche Artikel

arXiv – cs.LG • 28.01.2026 05:00

Verbessern Sie LLM‑Logik: Präzise Fehlerstrafe mit Prozess‑überwachtem RL

arXiv – cs.AI • 18.12.2025 05:00

LLM mit kritischer Denkweise: Stepwise Think-Critique verbessert Problemlösung

arXiv – cs.AI • 10.09.2025 05:00

Unleashing the True Potential of LLMs: A Feedback-Triggered Self-Correction with Long-Term Multipath Decoding

MarkTechPost • 30.08.2025 07:41

Microsoft AI Introduces rStar2-Agent: A 14B Math Reasoning Model Trained with Agentic Reinforcement Learning to Achieve Frontier-Level Performance

arXiv – cs.AI • 11.02.2026 05:00

CoMMa: Neue Game-Theoretic Multi-Agenten für präzisere Onkologie-Entscheidungen

arXiv – cs.AI • 10.02.2026 05:00

Halluzinationen in Sprachmodellen: OOD-Ansatz liefert effektive Erkennung