Suche nach Reasoning | meineki.news

Microsoft präsentiert Phi-4-Reasoning-Vision-15B: Kompaktes Modell für Mathematik

Microsoft hat heute das neue multimodale Modell Phi‑4‑Reasoning‑Vision‑15B vorgestellt. Das 15‑Billionen‑Parameter‑System arbeitet mit offe…

MarkTechPost 06.03.2026 23:53

Forschung

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuste Fortschritte im Zero-Shot-Kommonsense-Reasoning haben vortrainierte Sprachmodelle (PLMs) dazu befähigt, umfangreiches Allgemeinwisse…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neuro-Symbolische Finanzlogik: Zero-Halluzination mit deterministischen Ledgern

Standard Retrieval‑Augmented Generation (RAG) Modelle stoßen in hochriskanten Finanzanwendungen an ihre Grenzen. Sie können weder präzise a…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

Mathematisches Denken in großen Sprachmodellen erfordert bislang riesige Datensätze, doch die Effizienz der Datenverwendung bleibt ein ents…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Mehrere Runden, mehr Genauigkeit: MA‑RAG verbessert medizinisches Denken

Large Language Models (LLMs) zeigen großes Potenzial im medizinischen Frage‑Antwort‑Bereich, doch ihre Neigung zu Halluzinationen und veral…

arXiv – cs.AI 05.03.2026 05:00

Forschung

TATRA: Instanzbasiertes Prompting ohne Training – neue Methode für LLMs

Die Leistungsfähigkeit großer Sprachmodelle (LLMs) hat sich in den letzten Jahren stark verbessert, doch ihre Reaktion auf unterschiedliche…

arXiv – cs.AI 05.03.2026 05:00

Forschung

BeamPERL: RL mit verifizierbaren Belohnungen stärkt physikalisches Denken in kompakteren LLMs

Ein neues Verfahren namens BeamPERL nutzt Reinforcement Learning mit harten, verifizierbaren Belohnungen, um ein 1,5‑Billionen‑Parameter‑Mo…

arXiv – cs.AI 05.03.2026 05:00

Forschung

SEA-TS: Selbstlernender Agent revolutioniert Zeitreihenprognosen

Ein neues Forschungsprojekt namens SEA-TS (Self‑Evolving Agent for Time Series Algorithms) hat die Art und Weise, wie Zeitreihenprognosen e…

arXiv – cs.AI 06.03.2026 05:00

Praxis

Erstelle einen fortschrittlichen Tree-of-Thoughts-Agenten: Beam Search, Heuristik & Tiefenbeschränkung

In diesem Tutorial zeigen wir, wie man von Grund auf einen hochentwickelten Tree-of-Thoughts (ToT)-Agenten mit mehreren Zweigen konzipiert…

MarkTechPost 05.03.2026 17:00

Forschung

Neues neurosymbolisches Verfahren verschiebt Erzählungen effizienter als LLMs

Die Kunst der wirkungsvollen Kommunikation hängt stark davon ab, wie gut eine Botschaft mit der Erzählweise und Weltanschauung des Publikum…

arXiv – cs.AI 05.03.2026 05:00

Forschung

TTSR: Selbstreflexion im Testzeitraum für kontinuierliche Verbesserungen der Logik

Ein neues Verfahren namens TTSR (Test‑Time Self‑Reflection) ermöglicht es großen Sprachmodellen, ihre Rechenfähigkeiten während des Testens…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Phi-4-reasoning-vision-15B: Kompaktes Open-Weight-Modell für multimodale Logik

Das neu veröffentlichte Modell Phi‑4‑reasoning‑vision‑15B setzt einen neuen Standard für kompakte, offene multimodale Reasoning‑Modelle. Es…

arXiv – cs.AI 05.03.2026 05:00

Forschung

RAGNav: Neues Framework für Mehrziel‑Vision‑Language‑Navigation

Vision‑Language‑Navigation (VLN) entwickelt sich von der einfachen Wegfindung zu anspruchsvollen Mehrziel‑Aufgaben. Dabei müssen Agenten me…

arXiv – cs.AI 05.03.2026 05:00

Forschung

NeuroProlog: Neuromodell kombiniert Symbolik und KI für mathematisches Denken

NeuroProlog ist ein neurosymbolisches System, das mathematische Wortaufgaben in ausführbare Prolog‑Programme übersetzt und damit eine forma…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Mathematische Modelle: Erfolgreich, aber instabil – Das Tiefe‑Genauigkeit-Paradox

Mathematische Rechenmodelle werden heute in Bildung, automatisierten Tutorien und Entscheidungsunterstützungssystemen eingesetzt, obwohl si…

arXiv – cs.LG 05.03.2026 05:00

Forschung

Neues ERI-Benchmark: 57.750 Aufgaben für Ingenieur-LLMs

Ein brandneues Benchmark-Dataset namens Engineering Reasoning and Instruction (ERI) wurde veröffentlicht, das speziell dafür entwickelt wur…

arXiv – cs.AI 04.03.2026 05:00

Forschung

RxnNano: Kompakte LLMs für chemische Reaktionsvorhersage mit Curriculum

Die Vorhersage chemischer Reaktionen ist ein entscheidender Schritt, um die Entwicklung neuer Medikamente und die Planung von Synthesen zu…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Orchestrierte KI-Agenten revolutionieren wissenschaftliches Mehrschritt‑Denken

Multi‑Agent‑Frameworks mit großen Sprachmodellen versprechen komplexes Mehrschritt‑Denken, doch in wissenschaftlichen und wissensintensiven…

arXiv – cs.AI 04.03.2026 05:00

Forschung

MedFeat: KI-gestützte Feature Engineering für klinische Tabellendaten

In der Analyse klinischer Tabellendaten übertreffen klassische Modelle mit gezielter Feature Engineering häufig neuronale Netzwerke. Durch…

arXiv – cs.LG 04.03.2026 05:00

Forschung

LLM-basiertes Argument Mining trifft Logik: Ansatz für Debattenanalyse

Large Language Models (LLMs) haben in der Textanalyse und -generierung bemerkenswerte Erfolge erzielt, doch sie stoßen bei komplexen Diskur…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Roboter mit Retrieval-Reason-Act: Neue Ära der selbstständigen Aufgabenlösung

In einer wegweisenden Studie wird ein neues Paradigma für Robotik vorgestellt, das Roboter von passiven Ausführenden zu aktiven Information…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Neues Framework zur reproduzierbaren Bewertung logischer Reasoning-Agenten

Ein neu entwickeltes Bewertungsframework ermöglicht die systematische und nachvollziehbare Prüfung von logischen Reasoning-Agenten. Es legt…

arXiv – cs.AI 04.03.2026 05:00

Forschung

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Reinforcement‑Learning‑Modelle, die auf Group Relative Policy Optimization (GRPO) setzen, haben sich als effektive Methode etabliert, um di…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Neues Bewertungsframework prüft multimodale Modelle auf ECG-Logik

Ein neues arXiv-Papier (2603.00312v1) präsentiert einen innovativen Ansatz zur Bewertung der Denkprozesse multimodaler Sprachmodelle bei de…

arXiv – cs.AI 03.03.2026 05:00

Forschung

<h1>MC-Search: Benchmark für multimodale Agenten mit langen Beweisketten</h1> <p>Die neueste Veröffentlichung auf arXiv (2603.00873v1) stellt MC‑Search vor – ein wegweisendes Benchmark‑Set, das multimodale Agenten in ihrer Fähigkeit testet, komplexe, mehrstufige und wissensbasierte Aufgaben zu lösen. Im Gegensatz zu bisherigen Tests, die meist kurze Frage‑Antwort‑Ketten abbilden, umfasst MC‑Search 3 333 hochwertige Beispiele, die durchschnittlich 3,7 Schritte (Hops) enthalten und fünf typische Denkstrukture

arXiv – cs.AI 03.03.2026 05:00

Forschung

Markov-Analyse enthüllt, wann Chain-of-Thought wirklich hilft

Eine neue Studie auf arXiv (2603.00306v1) beleuchtet, warum die beliebte Chain-of-Thought (CoT)-Technik bei der Verbesserung von KI‑Reasoni…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Draft-Thinking: Effizientes Lösen von langen Argumentationsketten in LLMs

Die Technik des „Long Chain‑of‑Thought“ (CoT) hat sich als führendes Verfahren zur Steigerung der Rechenleistung großer Sprachmodelle etabl…

arXiv – cs.AI 03.03.2026 05:00

Forschung

MMCOMET: Neuer multimodaler Wissensgraph für kontextuelles Denken

ArXiv hat ein neues Forschungsprojekt vorgestellt, das die Grenzen des multimodalen Wissens erweitert: MMCOMET, ein umfangreicher Wissensgr…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Neues multimodales LLM nutzt Logik für bessere Domänenübertragbarkeit

In einem aktuellen Beitrag auf arXiv wird ein innovativer Ansatz vorgestellt, der die Herausforderung der Domänengeneralisation in tiefen L…

arXiv – cs.AI 02.03.2026 05:00

Forschung

EMO‑R3: Reflexives RL für emotionale Logik in multimodalen Modellen

**Use the `DIR` command with the `/S` switch** The simplest way to get a list of *every* file in a directory tree from a batch file is to l…

arXiv – cs.AI 02.03.2026 05:00

Finde Modelle, Firmen und Themen

Microsoft präsentiert Phi-4-Reasoning-Vision-15B: Kompaktes Modell für Mathematik

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuro-Symbolische Finanzlogik: Zero-Halluzination mit deterministischen Ledgern

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

Mehrere Runden, mehr Genauigkeit: MA‑RAG verbessert medizinisches Denken

TATRA: Instanzbasiertes Prompting ohne Training – neue Methode für LLMs

BeamPERL: RL mit verifizierbaren Belohnungen stärkt physikalisches Denken in kompakteren LLMs

SEA-TS: Selbstlernender Agent revolutioniert Zeitreihenprognosen

Erstelle einen fortschrittlichen Tree-of-Thoughts-Agenten: Beam Search, Heuristik & Tiefenbeschränkung

Neues neurosymbolisches Verfahren verschiebt Erzählungen effizienter als LLMs

TTSR: Selbstreflexion im Testzeitraum für kontinuierliche Verbesserungen der Logik

Phi-4-reasoning-vision-15B: Kompaktes Open-Weight-Modell für multimodale Logik

RAGNav: Neues Framework für Mehrziel‑Vision‑Language‑Navigation

NeuroProlog: Neuromodell kombiniert Symbolik und KI für mathematisches Denken

Mathematische Modelle: Erfolgreich, aber instabil – Das Tiefe‑Genauigkeit-Paradox

Neues ERI-Benchmark: 57.750 Aufgaben für Ingenieur-LLMs

RxnNano: Kompakte LLMs für chemische Reaktionsvorhersage mit Curriculum

Orchestrierte KI-Agenten revolutionieren wissenschaftliches Mehrschritt‑Denken

MedFeat: KI-gestützte Feature Engineering für klinische Tabellendaten

LLM-basiertes Argument Mining trifft Logik: Ansatz für Debattenanalyse

Roboter mit Retrieval-Reason-Act: Neue Ära der selbstständigen Aufgabenlösung

Neues Framework zur reproduzierbaren Bewertung logischer Reasoning-Agenten

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Neues Bewertungsframework prüft multimodale Modelle auf ECG-Logik

Markov-Analyse enthüllt, wann Chain-of-Thought wirklich hilft

Draft-Thinking: Effizientes Lösen von langen Argumentationsketten in LLMs

MMCOMET: Neuer multimodaler Wissensgraph für kontextuelles Denken

Neues multimodales LLM nutzt Logik für bessere Domänenübertragbarkeit

EMO‑R3: Reflexives RL für emotionale Logik in multimodalen Modellen

🍪 Cookie-Einstellungen