Suche nach Artefakte | meineki.news

Benchmark‑Gap bei Gesundheits‑LLMs: Analyse zeigt fehlende klinische Relevanz

Eine neue Analyse aus dem arXiv‑Repository hat einen gravierenden „Validity Gap“ in den gängigen Benchmarks für medizinische Sprachmodelle…

arXiv – cs.AI 20.03.2026 04:00

Forschung

TerraLingua: Aufdeckung offener Dynamiken in KI-Ökosystemen

TerraLingua ist eine neuartige, persistente Multi‑Agent-Umgebung, die speziell dafür entwickelt wurde, offene Dynamiken in künstlichen Ökos…

arXiv – cs.AI 19.03.2026 04:00

Forschung

AGRI-Fidelity: Bewertet verlässliche akustische Erklärungen bei Geflügelkrankheiten

In der Forschung zur Erkennung von Geflügelkrankheiten mit akustischen Signalen hat ein neues Bewertungsmodell namens AGRI-Fidelity die Mes…

arXiv – cs.LG 20.03.2026 04:00

Forschung

Neues System übertrifft Benchmarks bei Musik‑Stamm‑Restaurierung

In der ersten Ausgabe der Music Source Restoration (MSR) Challenge geht es darum, die ursprünglichen, unbearbeiteten Audiospuren aus vollst…

arXiv – cs.AI 19.03.2026 04:00

Forschung

Neuer Ansatz mit quantisierungsbewusstem Codec reduziert Deepfake‑Erkennung um 46 %

Forscher haben einen innovativen Ansatz entwickelt, der die hierarchische Struktur von Residual‑Vector‑Quantisierungs‑Codecs nutzt, um Spra…

arXiv – cs.AI 19.03.2026 04:00

Forschung

Mehr Zuverlässigkeit bei LLM-Annotation von Unterrichtsdiskursen mit Multi-Agenten

Large Language Models (LLMs) werden zunehmend als skalierbare Werkzeuge zur Annotation von Bildungsdaten eingesetzt. Sie können Unterrichts…

arXiv – cs.AI 17.03.2026 04:00

Forschung

Neue Methode: Global Evolutionary Steering verbessert LLM‑Aktivierungssteuerung

Die neueste Forschung aus dem arXiv‑Repository präsentiert GER‑steer, ein völlig trainingsfreies Verfahren, das die Steuerung von Large Lan…

arXiv – cs.AI 16.03.2026 04:00

Praxis

LangChain präsentiert Deep Agents: Strukturierter Runtime für mehrstufige KI-Agenten

LangChain hat mit Deep Agents ein neues Tool vorgestellt, das die Grenzen herkömmlicher LLM‑Agenten überwindet. Während die meisten Modelle…

MarkTechPost 15.03.2026 09:07

Forschung

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

Die Ptychographie ist eine hochpräzise Bildgebungstechnik, die in der Materialforschung weit verbreitet ist. Damit die Rekonstruktionen jed…

arXiv – cs.AI 09.03.2026 04:00

Forschung

EigenData: Selbstlernende Multi-Agent-Plattform für Daten-Synthese und -Audit

Die neueste Veröffentlichung von EigenData präsentiert eine selbstlernende Multi-Agent-Plattform, die den gesamten Lebenszyklus von Trainin…

arXiv – cs.AI 09.03.2026 04:00

Forschung

Globaler Umfrage-Ansatz beleuchtet kulturelle Erwartungen an Generative AI

Eine neue Studie aus dem arXiv-Repository liefert erstmals umfassende empirische Daten zu den weltweiten Einstellungen gegenüber der kultur…

arXiv – cs.AI 09.03.2026 04:00

Forschung

MOOSEnger: KI-Agent für MOOSE-Umgebung beschleunigt Simulationen

Der neue KI-Agent MOOSEnger richtet sich speziell an Anwender des Multiphysics Object‑Oriented Simulation Environment (MOOSE). Durch einen…

arXiv – cs.AI 06.03.2026 05:00

Forschung

REGAL: Architektur für deterministische KI-Integration in Unternehmens‑Telemetrie

In modernen Unternehmens‑Engineering‑Organisationen entstehen täglich riesige Mengen heterogener Telemetrie‑Daten aus Versionskontrollsyste…

arXiv – cs.AI 04.03.2026 05:00

Forschung

CARE: LLM-Fehler getrennt von echter Qualität – 26,8 % weniger Fehler

In der Welt der großen Sprachmodelle (LLMs) ist die Bewertung von Texten mit sogenannten „LLM-as-a-judge“-Ensembles zur Standardmethode gew…

arXiv – cs.LG 03.03.2026 05:00

Forschung

ACAR: Adaptive Routing für Multi-Model-Ensemble mit auditierbarem Entscheidungsweg

ACAR (Adaptive Complexity and Attribution Routing) ist ein neues Messframework, das die Orchestrierung mehrerer KI‑Modelle unter vollständi…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Gewichtsfelder ohne Interferenz: Verluste bei LLM‑Erweiterungen vermeiden

In einer neuen Studie von ArXiv (2602.18628v1) wird ein innovatives Konzept vorgestellt, das die klassische Idee fester Gewichtvektoren in…

arXiv – cs.LG 24.02.2026 05:00

Forschung

LLM‑Sicherheit: Aktivierungsentanglement erkennt versteckte Jailbreaks

Moderne Sprachmodelle bleiben anfällig für raffinierte Jailbreak‑Prompts, die flüssig und semantisch kohärent formuliert sind. Besonders pr…

arXiv – cs.AI 24.02.2026 05:00

Forschung

Rationale Fehlanpassung: Wie Modellfehler KI in Fallen führen

Die rasche Einführung von Large Language Models und KI-Agenten in kritische gesellschaftliche und technische Bereiche wird durch anhaltende…

arXiv – cs.AI 23.02.2026 05:00

Forschung

Physikalische Grenzen treiben Sprache und Logik zum Überleben

Ein neues arXiv‑Veröffentlichung stellt die herkömmliche Sichtweise in Frage, dass Semantik lediglich ein statisches Merkmal von latenten R…

arXiv – cs.AI 24.02.2026 05:00

Forschung

Agentisches Auslernen: LLM-Agenten treffen maschinelles Auslernen

In einer bahnbrechenden Veröffentlichung auf arXiv wird das Konzept des agentischen Auslernens vorgestellt, das gezielt sensible Informatio…

arXiv – cs.AI 23.02.2026 05:00

Forschung

VLMs im autonomen Fahren: Textbias in synthetischen MCQAs drastisch reduziert

In einer neuen Studie wurde gezeigt, dass synthetisch generierte Multiple‑Choice‑Fragen (MCQAs) für Vision‑Language‑Modelle (VLMs) im Berei…

arXiv – cs.LG 23.02.2026 05:00

Forschung

DesignAsCode: Grafikgestaltung – Editierbarkeit & visuelle Qualität

In der Welt der automatisierten Grafikgestaltung steht die Herausforderung im Vordergrund, ein Design zu erzeugen, das sowohl optisch überz…

arXiv – cs.AI 23.02.2026 05:00

Forschung

BotzoneBench: Skalierbare LLM-Bewertung mit abgestuften KI-Ankern

Der Text ist bereits auf Deutsch. Hier ist er noch einmal zur Bestätigung: ```text Die Entwicklung von KI-gestützten Systemen für die mediz…

arXiv – cs.AI 17.02.2026 05:00

Forschung

Neue geometrische Taxonomie klassifiziert Halluzinationen in Sprachmodellen

Wissenschaftler haben eine neue, geometrisch fundierte Klassifikation von Halluzinationen in großen Sprachmodellen (LLMs) vorgestellt. Die…

arXiv – cs.AI 17.02.2026 05:00

Forschung

Neues Deep-Learning-Modell verbessert Prognose bei Glioblastom trotz Bildheterogenität

Ein neu entwickeltes Deep-Learning-Framework namens TopoGBM verspricht, die Prognosegenauigkeit bei Glioblastom (GBM) zu steigern, indem es…

arXiv – cs.LG 13.02.2026 05:00

Forschung

KI-Modell prognostiziert Nachhaltigkeit von Open-Source-Projekten

Ein neues KI-Modell prognostiziert die Nachhaltigkeit von Open-Source-Software (OSS) anhand von Zeitreihen und erklärbarer KI. Das Modell b…

arXiv – cs.AI 11.02.2026 05:00

Forschung

Neues Verfahren entschlüsselt Gehirnverbindungen trotz indirekter Messungen

Die gezielte Ermittlung von gerichteten Verbindungen im Gehirn aus neuroimaging-Daten ist ein schwieriges Problem. Hemodynamische Filterung…

arXiv – cs.AI 11.02.2026 05:00

Forschung

E2CAR: 2D-CNN-Framework für Echtzeit-EEG-Artifact-Entfernung auf Edge-Geräten

Elektroenzephalogramme (EEG) werden häufig durch Artefakte verunreinigt, was die Genauigkeit nachfolgender Analysen stark beeinträchtigt. T…

arXiv – cs.AI 11.02.2026 05:00

Aktuell

Runway: Mit Motion Sketch in Minuten aus Skizzen Video-Clips erstellen

Runway hat mit seinem neuen Tool Motion Sketch die Kluft zwischen abstrakter Vorstellung und konkretem Videooutput deutlich verkleinert. Mi…

ZDNet – Artificial Intelligence 10.02.2026 03:01

Forschung

SVRepair: Multimodales APR nutzt strukturierte visuelle Analyse

In der Welt der automatisierten Programmreparatur (APR) hat ein neues Verfahren namens SVRepair die Messlatte höher gelegt. Durch die Kombi…

arXiv – cs.AI 09.02.2026 05:00

Finde Modelle, Firmen und Themen

Benchmark‑Gap bei Gesundheits‑LLMs: Analyse zeigt fehlende klinische Relevanz

TerraLingua: Aufdeckung offener Dynamiken in KI-Ökosystemen

AGRI-Fidelity: Bewertet verlässliche akustische Erklärungen bei Geflügelkrankheiten

Neues System übertrifft Benchmarks bei Musik‑Stamm‑Restaurierung

Neuer Ansatz mit quantisierungsbewusstem Codec reduziert Deepfake‑Erkennung um 46 %

Mehr Zuverlässigkeit bei LLM-Annotation von Unterrichtsdiskursen mit Multi-Agenten

Neue Methode: Global Evolutionary Steering verbessert LLM‑Aktivierungssteuerung

LangChain präsentiert Deep Agents: Strukturierter Runtime für mehrstufige KI-Agenten

KI-gestützte Evolution entdeckt neue Regularisierungsmethoden für Ptychographie

EigenData: Selbstlernende Multi-Agent-Plattform für Daten-Synthese und -Audit

Globaler Umfrage-Ansatz beleuchtet kulturelle Erwartungen an Generative AI

MOOSEnger: KI-Agent für MOOSE-Umgebung beschleunigt Simulationen

REGAL: Architektur für deterministische KI-Integration in Unternehmens‑Telemetrie

CARE: LLM-Fehler getrennt von echter Qualität – 26,8 % weniger Fehler

ACAR: Adaptive Routing für Multi-Model-Ensemble mit auditierbarem Entscheidungsweg

Gewichtsfelder ohne Interferenz: Verluste bei LLM‑Erweiterungen vermeiden

LLM‑Sicherheit: Aktivierungsentanglement erkennt versteckte Jailbreaks

Rationale Fehlanpassung: Wie Modellfehler KI in Fallen führen

Physikalische Grenzen treiben Sprache und Logik zum Überleben

Agentisches Auslernen: LLM-Agenten treffen maschinelles Auslernen

VLMs im autonomen Fahren: Textbias in synthetischen MCQAs drastisch reduziert

DesignAsCode: Grafikgestaltung – Editierbarkeit & visuelle Qualität

BotzoneBench: Skalierbare LLM-Bewertung mit abgestuften KI-Ankern

Neue geometrische Taxonomie klassifiziert Halluzinationen in Sprachmodellen

Neues Deep-Learning-Modell verbessert Prognose bei Glioblastom trotz Bildheterogenität

KI-Modell prognostiziert Nachhaltigkeit von Open-Source-Projekten

Neues Verfahren entschlüsselt Gehirnverbindungen trotz indirekter Messungen

E2CAR: 2D-CNN-Framework für Echtzeit-EEG-Artifact-Entfernung auf Edge-Geräten

Runway: Mit Motion Sketch in Minuten aus Skizzen Video-Clips erstellen

SVRepair: Multimodales APR nutzt strukturierte visuelle Analyse

🍪 Cookie-Einstellungen

Neuer Ansatz mit quantisierungsbewusstem Codec reduziert Deepfake‑Erkennung um 46 %

CARE: LLM-Fehler getrennt von echter Qualität – 26,8 % weniger Fehler