Suche nach ICU | meineki.news

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> <p>Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen.</p> <p>Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI 06.03.2026 05:00

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

Mathematisches Denken in großen Sprachmodellen erfordert bislang riesige Datensätze, doch die Effizienz der Datenverwendung bleibt ein ents…

arXiv – cs.AI 06.03.2026 05:00

Forschung

KI für Landwirtschaft: Feinabgestimmtes Modell liefert präzise, sichere Beratung

In einer wegweisenden Studie zeigen Forscher, dass große Sprachmodelle (LLMs) das Potenzial besitzen, Landwirte mit maßgeschneiderter Berat…

arXiv – cs.AI 05.03.2026 05:00

Forschung

RxnNano: Kompakte LLMs für chemische Reaktionsvorhersage mit Curriculum

Die Vorhersage chemischer Reaktionen ist ein entscheidender Schritt, um die Entwicklung neuer Medikamente und die Planung von Synthesen zu…

arXiv – cs.LG 04.03.2026 05:00

Forschung

MedFeat: KI-gestützte Feature Engineering für klinische Tabellendaten

In der Analyse klinischer Tabellendaten übertreffen klassische Modelle mit gezielter Feature Engineering häufig neuronale Netzwerke. Durch…

arXiv – cs.LG 04.03.2026 05:00

Forschung

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Reinforcement‑Learning‑Modelle, die auf Group Relative Policy Optimization (GRPO) setzen, haben sich als effektive Methode etabliert, um di…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Draft-Thinking: Effizientes Lösen von langen Argumentationsketten in LLMs

Die Technik des „Long Chain‑of‑Thought“ (CoT) hat sich als führendes Verfahren zur Steigerung der Rechenleistung großer Sprachmodelle etabl…

arXiv – cs.AI 03.03.2026 05:00

Forschung

K²-Agent: Hierarchischer Lernagent für mobile Geräte mit selbstentwickeltem Wissen

Ein neuer Ansatz namens K²-Agent verspricht, die Grenzen herkömmlicher mobile Geräte‑Controller zu sprengen. Durch die Trennung von deklara…

arXiv – cs.AI 03.03.2026 05:00

Forschung

MLLMs gegen visuelle Täuschungen: Adversarial Training stärkt Robustheit

Ein brandneues Forschungsdokument aus dem Bereich der multimodalen großen Sprachmodelle (MLLMs) zeigt, wie man die Wahrnehmungsstabilität d…

arXiv – cs.LG 27.02.2026 05:00

Forschung

Tool‑R0: Selbstlernende LLM‑Agenten entwickeln sich ohne Daten

In einer wegweisenden Veröffentlichung präsentiert Tool‑R0 ein völlig neues Konzept für die Ausbildung von Sprachmodell‑Agenten, die eigens…

arXiv – cs.LG 26.02.2026 05:00

Forschung

GradAlign: Gradientbasierte Datenauswahl verbessert RL für LLMs

Reinforcement Learning (RL) hat sich zu einem zentralen Post‑Training‑Paradigma für große Sprachmodelle (LLMs) entwickelt, doch seine Leist…

arXiv – cs.LG 26.02.2026 05:00

Forschung

Curriculum Learning spart bei BERT 33 % Trainingszeit – Modelle profitieren nicht

Ein neues arXiv‑Paper zeigt, dass ein progressives Daten‑Scheduling – ein Curriculum‑Learning‑Ansatz – die Trainingszeit von BERT um rund 3…

arXiv – cs.AI 26.02.2026 05:00

Forschung

NoRD: Vision-Language-Action-Modell fährt ohne umfangreiche Daten und Reasoning

Ein neues Forschungsergebnis aus dem Bereich autonomes Fahren präsentiert NoRD, ein Vision‑Language‑Action‑Modell, das ohne umfangreiche Da…

arXiv – cs.AI 25.02.2026 05:00

Forschung

ACTOR-CURATOR: adaptives Curriculum steigert LLM-Post-Training

Ein neues Framework namens ACTOR-CURATOR verspricht, die Nachschulung großer Sprachmodelle mit Reinforcement Learning effizienter zu gestal…

arXiv – cs.LG 25.02.2026 05:00

Forschung

<p>LLM-Agenten lernen, Tool‑Beschreibungen ohne Ausführungsspur zu nutzen</p> <p>Eine neue Methode namens Trace‑Free+ ermöglicht es großen Sprachmodellen, Tool‑Schnittstellen ohne vorherige Ausführungsspur zu verstehen und zu nutzen. Durch ein schrittweises Curriculum überträgt das System Wissen von reichlich dokumentierten Szenarien auf reale Einsatzbedingungen, in denen keine Trace‑Daten verfügbar sind.</p> <p>Das Team hat ein umfangreiches Datenset hochwertiger Tool‑Interfaces erstellt und die Technik an

arXiv – cs.AI 25.02.2026 05:00

Forschung

UBio-MolFM: Molekularmodell vereint QM-Genauigkeit und biologische Skalierung

Die neueste Veröffentlichung von UBio-MolFM präsentiert ein universelles Molekularmodell, das die bisherige Kluft zwischen quantenmechanisc…

arXiv – cs.AI 23.02.2026 05:00

Forschung

<h1>CoT-Distillation: Curriculum Learning mit strukturiertem Maskieren & GRPO</h1> <p>Die Übertragung von Chain‑of‑Thought‑(CoT)‑Logik aus großen Sprachmodellen in kompakte Nachschreibermodelle stellt ein zentrales Problem dar: die ausführlichen Begründungen der Lehrermodelle sind für kleinere Modelle oft zu umfangreich, um sie exakt zu replizieren. Traditionelle Ansätze reduzieren die Logik auf einen einzigen Schritt, wodurch die wertvolle Interpretierbarkeit verloren geht.</p> <p>In der neuen Studie wird

arXiv – cs.AI 23.02.2026 05:00

Forschung

VLMs im autonomen Fahren: Textbias in synthetischen MCQAs drastisch reduziert

In einer neuen Studie wurde gezeigt, dass synthetisch generierte Multiple‑Choice‑Fragen (MCQAs) für Vision‑Language‑Modelle (VLMs) im Berei…

arXiv – cs.LG 23.02.2026 05:00

Forschung

PBS beschleunigt Sprachmodelltraining: Verlustbasierte Stichprobenpriorisierung

Ein neues Verfahren namens Predictive Batch Scheduling (PBS) verspricht, das Training von Sprachmodellen deutlich zu beschleunigen. Dabei w…

arXiv – cs.AI 20.02.2026 05:00

Forschung

Resp-Agent: KI-System für multimodale Atemgeräusche und Diagnostik

Die aktuelle KI-basierte Atemgeräuschdiagnostik leidet unter zwei wesentlichen Problemen: Erstens geht bei der Umwandlung von Audiosignalen…

arXiv – cs.AI 19.02.2026 05:00

Forschung

SeleCom: Query-Conditioned Soft Compression für Retrieval-Augmented Generation

Retrieval-Augmented Generation (RAG) verbindet große Sprachmodelle mit externem Wissen und ist besonders bei Web-basierten Aufgaben beliebt…

arXiv – cs.AI 19.02.2026 05:00

Forschung

EduResearchBench: Neue Benchmark für KI-gestützte Bildungsforschung

Mit dem neuen EduResearchBench wird die Leistungsfähigkeit von Large Language Models (LLMs) im Bereich der Bildungsforschung systematisch b…

arXiv – cs.AI 18.02.2026 05:00

Forschung

AgriWorld: KI-Framework für landwirtschaftliche Analyse mit LLM-Agenten

In der Landwirtschaft werden immer mehr große Sprachmodelle (LLMs) mit umfangreichen, zeitlich und räumlich vernetzten Daten wie multispekt…

arXiv – cs.AI 18.02.2026 05:00

Forschung

Maschinelles Lernen kompensiert CO‑Datenverluste in Copernicus‑Reanalysen

Der Copernicus Atmospheric Monitoring Service erstellt Reanalyseprodukte für die atmosphärische Zusammensetzung, indem er Modellsimulatione…

arXiv – cs.AI 18.02.2026 05:00

Forschung

Cast‑R1: Lernbasierte Entscheidungsreihen für präzise Zeitreihenprognosen

Traditionelle Zeitreihenprognosen basieren meist auf modellzentrierten Ansätzen, die die Vorhersage als einmalige Abbildung von historische…

arXiv – cs.LG 17.02.2026 05:00

Forschung

VI-CuRL: Stabilisierung von verifierunabhängigem RL-Reasoning durch Varianzreduktion

Reinforcement Learning mit verifizierbaren Belohnungen (RLVR) hat sich als führendes Verfahren zur Verbesserung der Argumentationsfähigkeit…

arXiv – cs.LG 16.02.2026 05:00

Forschung

OmniCustom: Synchronisierte Audio‑Video‑Anpassung mit einem einzigen Modell

In einer wegweisenden Veröffentlichung aus dem arXiv‑Repository wird OmniCustom vorgestellt – ein neues Framework, das die Grenzen der Vide…

arXiv – cs.AI 16.02.2026 05:00

Forschung

RankLLM: Fragenbasierte Bewertung von LLMs – neue Messmethode

In der Forschung zu großen Sprachmodellen (LLMs) sind Benchmarks ein zentrales Instrument, um Leistungen systematisch zu vergleichen und Fo…

arXiv – cs.AI 16.02.2026 05:00

Forschung

Reinforcement Learning spart Energie bei Robotik für Infrastrukturwartung

Mit dem rasanten Ausbau intelligenter Infrastrukturen und Smart Cities wird die Wartung von Anlagen immer komplexer. Robotik muss dabei nic…

arXiv – cs.AI 16.02.2026 05:00

Forschung

MAPLE: Modality-Aware Post-Training – 30 % Genauigkeitsgewinn, 3‑fach Konvergenz

Multimodale Sprachmodelle kombinieren Text, Audio und Video zu einer einheitlichen Denkweise. In der Praxis werden jedoch bei bestehenden R…

arXiv – cs.AI 13.02.2026 05:00

Finde Modelle, Firmen und Themen

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

KI für Landwirtschaft: Feinabgestimmtes Modell liefert präzise, sichere Beratung

RxnNano: Kompakte LLMs für chemische Reaktionsvorhersage mit Curriculum

MedFeat: KI-gestützte Feature Engineering für klinische Tabellendaten

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Draft-Thinking: Effizientes Lösen von langen Argumentationsketten in LLMs

K²-Agent: Hierarchischer Lernagent für mobile Geräte mit selbstentwickeltem Wissen

MLLMs gegen visuelle Täuschungen: Adversarial Training stärkt Robustheit

Tool‑R0: Selbstlernende LLM‑Agenten entwickeln sich ohne Daten

GradAlign: Gradientbasierte Datenauswahl verbessert RL für LLMs

Curriculum Learning spart bei BERT 33 % Trainingszeit – Modelle profitieren nicht

NoRD: Vision-Language-Action-Modell fährt ohne umfangreiche Daten und Reasoning

ACTOR-CURATOR: adaptives Curriculum steigert LLM-Post-Training

UBio-MolFM: Molekularmodell vereint QM-Genauigkeit und biologische Skalierung

VLMs im autonomen Fahren: Textbias in synthetischen MCQAs drastisch reduziert

PBS beschleunigt Sprachmodelltraining: Verlustbasierte Stichprobenpriorisierung

Resp-Agent: KI-System für multimodale Atemgeräusche und Diagnostik

SeleCom: Query-Conditioned Soft Compression für Retrieval-Augmented Generation

EduResearchBench: Neue Benchmark für KI-gestützte Bildungsforschung

AgriWorld: KI-Framework für landwirtschaftliche Analyse mit LLM-Agenten

Maschinelles Lernen kompensiert CO‑Datenverluste in Copernicus‑Reanalysen

Cast‑R1: Lernbasierte Entscheidungsreihen für präzise Zeitreihenprognosen

VI-CuRL: Stabilisierung von verifierunabhängigem RL-Reasoning durch Varianzreduktion

OmniCustom: Synchronisierte Audio‑Video‑Anpassung mit einem einzigen Modell

RankLLM: Fragenbasierte Bewertung von LLMs – neue Messmethode

Reinforcement Learning spart Energie bei Robotik für Infrastrukturwartung

MAPLE: Modality-Aware Post-Training – 30 % Genauigkeitsgewinn, 3‑fach Konvergenz

🍪 Cookie-Einstellungen

Curriculum Learning spart bei BERT 33 % Trainingszeit – Modelle profitieren nicht

MAPLE: Modality-Aware Post-Training – 30 % Genauigkeitsgewinn, 3‑fach Konvergenz