Suche nach DEM | meineki.news

Reinforcement Learning optimiert Diffusions-LLMs: Entropie-gesteuerte Schritte & Vorteile

Forscher haben einen neuen Ansatz entwickelt, mit dem Reinforcement Learning (RL) die Leistung von Diffusions-Sprachmodellen (DLMs) deutlic…

arXiv – cs.LG 16.03.2026 04:00

Forschung

Neues Benchmark zeigt Schwächen von LLMs bei mehrstufiger medizinischer Diagnostik

Wissenschaftler haben ein neues, zweisprachiges Benchmark namens ShatterMed‑QA entwickelt, das die Fähigkeit großer Sprachmodelle (LLMs) au…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Neues Tool erkennt falsch zitierte Quellen im wissenschaftlichen Netz

Wissenschaftliche Publikationen bilden ein riesiges Netzwerk aus Zitaten, doch immer häufiger werden Quellen so verwendet, dass sie die beh…

arXiv – cs.AI 16.03.2026 04:00

Forschung

LLM-Agenten: Neue Tests zeigen Schwäche bei semantischer Stabilität

Large Language Models (LLMs) werden zunehmend als eigenständige Denkagenten eingesetzt, um Entscheidungen zu unterstützen, wissenschaftlich…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Stitching von Vision Foundation Models: Neue Wege zur Integration

Model Stitching, bei dem die frühen Schichten eines Modells mit den späteren Schichten eines anderen verbunden werden, hat sich als nützlic…

arXiv – cs.AI 16.03.2026 04:00

Forschung

VQQA: Agentenbasierte Methode verbessert Videoqualität effizient

Die neueste Veröffentlichung auf arXiv präsentiert VQQA – ein innovatives, agentenbasiertes Framework, das die Bewertung und Optimierung vo…

arXiv – cs.AI 16.03.2026 04:00

Forschung

<p>Ein neues, formal verifiziertes Messwerkzeug namens Budget‑Sensitive Discovery Score (BSDS) wurde vorgestellt, das die Bewertung von KI‑gestützten Auswahlstrategien in der wissenschaftlichen Forschung revolutioniert. Durch die Kombination von Fehlentdeckungs‑ und Abweichungspenalitäten liefert der BSDS ein umfassendes Bild der Effizienz von Auswahlmethoden, während die daraus abgeleitete Discovery Quality Score (DQS) eine einheitliche Kennzahl bietet, die Manipulationen durch gezielte Budgetwahl ausschl

Die Autoren nutzten den Lean‑4-Beweisassistenten, um 20 Theoreme zu prüfen, die die mathematische Richtigkeit des Scores garantieren. Im pr…

arXiv – cs.AI 16.03.2026 04:00

Forschung

RetroReasoner: KI-Modell revolutioniert strategische Retrosynthese

Die Vorhersage von Retrosynthesen ist ein zentrales Problem der organischen Chemie, bei dem für ein gegebenes Produktmolekül die passenden…

arXiv – cs.LG 16.03.2026 04:00

Forschung

AIM: Ein Modell, das mit Logit-Umverteilung vielseitig moduliert

Die Forschung auf arXiv (2603.12755v1) präsentiert AIM, ein neues Paradigma zur Modulation von KI-Modellen. Ziel ist es, ein einzelnes Mode…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Modal Neuronale Netzwerke: Deep Learning trifft Finanz-Interpretierbarkeit

Die Finanzwelt steht vor einer spannenden Herausforderung: Deep‑Learning‑Modelle liefern beeindruckende Ergebnisse, doch regulatorische Vor…

arXiv – cs.LG 16.03.2026 04:00

Forschung

KI-Planungsrahmen für webbasierte LLM-Agenten

Ein neues KI-Planungsframework für webbasierte LLM-Agenten wurde auf arXiv veröffentlicht. Das Papier adressiert die zentrale Herausforderu…

arXiv – cs.AI 16.03.2026 04:00

Forschung

CRYSTAL: Neuer Benchmark für transparente multimodale Logikprüfung

Mit dem neuen Benchmark CRYSTAL (Clear Reasoning via Yielded Steps, Traceability and Logic) stellen Forscher ein umfangreiches Diagnostik-S…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Neue Methode nutzt interne LLM-Informationen für bessere Distillation

Beim Wissenstransfer von großen Sprachmodellen (LLMs) wird häufig angenommen, dass die Ausgabe des Lehrers ein hochwertiges Trainingssignal…

arXiv – cs.AI 16.03.2026 04:00

Forschung

SPARROW: Pixelgenaues Video-MLLM mit verbesserter räumlicher Präzision

Ein neues multimodales Sprachmodell namens SPARROW setzt neue Maßstäbe für die Analyse von Videos auf Pixelebene. Durch die Kombination von…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Sprachmodelle: Prompt-Injection gelingt dank Rollenverwirrung

Obwohl Sprachmodelle umfangreiche Sicherheitstrainings durchlaufen, bleiben sie weiterhin anfällig für Prompt‑Injection‑Angriffe. In einer…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Neue Datenaugmentation löst Modality-Gap bei kontextbasierten Prognosen

Die neueste Forschung im Bereich der kontextbasierten Prognose (CAF) zeigt, dass multimodale Modelle bislang nicht die erwartete Leistungss…

arXiv – cs.LG 16.03.2026 04:00

Forschung

Neues Netzwerk HCP-DCNet revolutioniert kausales Verständnis in KI

Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz hat ein innovatives Modell namens Hierarchical Causal Primitive Dyn…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Neues Optimierungsframework nutzt MDL als treibende Kraft in Deep Learning

Ein neues Optimierungsframework, das das Minimum Description Length (MDL)-Prinzip in die Trainingsdynamik tiefer neuronaler Netze integrier…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Generatives Diffusionsmodell revolutioniert Vorhersage chaotischer Strömungen

Die Simulation chaotischer, hochdimensionaler Strömungssysteme erfordert bislang enorme Rechenressourcen. Um diese Kosten zu senken, entwic…

arXiv – cs.LG 16.03.2026 04:00

Forschung

FastDSAC: Entropie-gestützte Humanoidensteuerung überwindet Dimensionen

Die Skalierung von Maximum‑Entropy‑Reinforcement‑Learning (RL) auf hochdimensionale Humanoidensteuerung bleibt eine große Herausforderung…

arXiv – cs.LG 16.03.2026 04:00

Forschung

Lineare Surrogates enthüllen Skalierungseffekte in Sprachmodellen

Eine neue Untersuchung zeigt, dass die Tiefenverläufe von Transformer‑Modellen durch kompakte lineare Modelle beschrieben werden können, ob…

arXiv – cs.LG 16.03.2026 04:00

Forschung

Neue Methode: Global Evolutionary Steering verbessert LLM‑Aktivierungssteuerung

Die neueste Forschung aus dem arXiv‑Repository präsentiert GER‑steer, ein völlig trainingsfreies Verfahren, das die Steuerung von Large Lan…

arXiv – cs.AI 16.03.2026 04:00

Forschung

DIME: Neuronales Modell für Wahrnehmung, Gedächtnis, Bewertung & Bewusstsein

Wissenschaftler haben ein neues, umfassendes neuronales Modell namens DIME (Detect‑Integrate‑Mark‑Execute) vorgestellt, das die bislang get…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Mensch‑KI‑Team: Neue Proxy‑Modelle beschleunigen Materialforschung

In einem wegweisenden Ansatz arbeiten menschliche Experten und künstliche Intelligenz Hand in Hand, um die Entdeckung neuer Materialien zu…

arXiv – cs.LG 16.03.2026 04:00

Forschung

Neues Verfahren: Swap‑Guided Preference Learning verbessert personalisierte RLHF

In der Welt der künstlichen Intelligenz gewinnt die Ausrichtung von Modellen an menschlichen Werten immer mehr an Bedeutung. Das neu veröff…

arXiv – cs.LG 16.03.2026 04:00

Forschung

KI-gestützte Cyber‑Risk‑Analyse: Vorfälle zu MITRE ATT&CK und Kontrollen

Mit der steigenden Häufigkeit von Cyberangriffen stehen vor allem kleine Unternehmen vor einer großen Herausforderung: Sie verfügen oft nic…

arXiv – cs.AI 16.03.2026 04:00

Forschung

Von Müll zu Gold: Wie Datenarchitektur die Vorhersagekraft stärkt

In einer bahnbrechenden Studie wird das weit verbreitete „Garbage‑In, Garbage‑Out“-Mantra neu bewertet: Moderne tabellarische Lernmodelle e…

arXiv – cs.AI 16.03.2026 04:00

Forschung

LightMoE: Reduzierung von MoE-Redundanz durch Expertenersatz

Die neueste Veröffentlichung von LightMoE präsentiert einen innovativen Ansatz, um die Speicherbelastung von Mixture-of-Experts (MoE) basie…

arXiv – cs.LG 16.03.2026 04:00

Forschung

NeuroLoRA: Neuromodulation für effiziente Multi-Task-Anpassung

Parameter‑Effizientes Fine‑Tuning (PEFT) hat sich als unverzichtbare Methode etabliert, um große Sprachmodelle (LLMs) für spezifische Aufga…

arXiv – cs.LG 16.03.2026 04:00

Forschung

TreeKD: Entscheidungsbäume stärken LLMs bei Molekülvorhersagen

Die Vorhersage molekularer Eigenschaften ist ein zentrales Problem in der Wirkstoffentwicklung. Große Sprachmodelle (LLMs) zeigen zwar viel…

arXiv – cs.LG 16.03.2026 04:00

Finde Modelle, Firmen und Themen

Reinforcement Learning optimiert Diffusions-LLMs: Entropie-gesteuerte Schritte & Vorteile

Neues Benchmark zeigt Schwächen von LLMs bei mehrstufiger medizinischer Diagnostik

Neues Tool erkennt falsch zitierte Quellen im wissenschaftlichen Netz

LLM-Agenten: Neue Tests zeigen Schwäche bei semantischer Stabilität

Stitching von Vision Foundation Models: Neue Wege zur Integration

VQQA: Agentenbasierte Methode verbessert Videoqualität effizient

RetroReasoner: KI-Modell revolutioniert strategische Retrosynthese

AIM: Ein Modell, das mit Logit-Umverteilung vielseitig moduliert

Modal Neuronale Netzwerke: Deep Learning trifft Finanz-Interpretierbarkeit

KI-Planungsrahmen für webbasierte LLM-Agenten

CRYSTAL: Neuer Benchmark für transparente multimodale Logikprüfung

Neue Methode nutzt interne LLM-Informationen für bessere Distillation

SPARROW: Pixelgenaues Video-MLLM mit verbesserter räumlicher Präzision

Sprachmodelle: Prompt-Injection gelingt dank Rollenverwirrung

Neue Datenaugmentation löst Modality-Gap bei kontextbasierten Prognosen

Neues Netzwerk HCP-DCNet revolutioniert kausales Verständnis in KI

Neues Optimierungsframework nutzt MDL als treibende Kraft in Deep Learning

Generatives Diffusionsmodell revolutioniert Vorhersage chaotischer Strömungen

FastDSAC: Entropie-gestützte Humanoidensteuerung überwindet Dimensionen

Lineare Surrogates enthüllen Skalierungseffekte in Sprachmodellen

Neue Methode: Global Evolutionary Steering verbessert LLM‑Aktivierungssteuerung

DIME: Neuronales Modell für Wahrnehmung, Gedächtnis, Bewertung & Bewusstsein

Mensch‑KI‑Team: Neue Proxy‑Modelle beschleunigen Materialforschung

Neues Verfahren: Swap‑Guided Preference Learning verbessert personalisierte RLHF

KI-gestützte Cyber‑Risk‑Analyse: Vorfälle zu MITRE ATT&CK und Kontrollen

Von Müll zu Gold: Wie Datenarchitektur die Vorhersagekraft stärkt

LightMoE: Reduzierung von MoE-Redundanz durch Expertenersatz

NeuroLoRA: Neuromodulation für effiziente Multi-Task-Anpassung

TreeKD: Entscheidungsbäume stärken LLMs bei Molekülvorhersagen

🍪 Cookie-Einstellungen