KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Language Models”

SecureRAG-RTL: LLM-gestützte Hardware‑Sicherheitsprüfung +30 % Erkennungsrate

Large Language Models (LLMs) haben in der natürlichen Sprachverarbeitung enorme Fortschritte erzielt, doch ihre Anwendung in der Hardware‑S…

arXiv – cs.AI 09.03.2026 04:00

LLM‑Moralentscheidungen: Wie leicht sie durch Perspektivwechsel manipuliert werden

In einer aktuellen Untersuchung wurde gezeigt, dass große Sprachmodelle, die immer häufiger für alltägliche moralische Ratschläge eingesetz…

arXiv – cs.AI 09.03.2026 04:00

Google führt Bayesian-Upgrade ein: Neue Lernmethode stärkt LLM-Logik

Large Language Models sind hervorragende Nachahmer, doch wenn es darum geht, ihre Überzeugungen anhand neuer Daten zu aktualisieren, zeigen…

MarkTechPost 09.03.2026 08:23

Google präsentiert Android Bench – neues LLM-Benchmark für Android

Google hat Android Bench veröffentlicht, ein neues Leaderboard und Evaluationsframework, das speziell darauf abzielt, die Leistung von Larg…

MarkTechPost 06.03.2026 19:53

<p>DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 %</p> <p>In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar.</p> <p>Der D

arXiv – cs.AI 06.03.2026 05:00

VISA: Präzise Werteanpassung von LLMs ohne Qualitätsverlust

Ein neues Verfahren namens VISA (Value Injection via Shielded Adaptation) verspricht, Large Language Models (LLMs) genauer an menschliche W…

arXiv – cs.AI 06.03.2026 05:00

Automatisierte Datenauswertung: KI-gestütztes Risikobewertungs-Framework

Large Language Models (LLMs) werden zunehmend in kritische Entscheidungsprozesse eingebunden, was die Nachfrage nach zuverlässiger und auto…

arXiv – cs.AI 06.03.2026 05:00

K-Gen: Sprachmodell für interpretierbare Trajektorien in autonomen Fahrsimulation

In der autonomen Fahrsimulation steht die Erzeugung realistischer und vielfältiger Fahrtrajektorien im Fokus. K-Gen, ein multimodales Sprac…

arXiv – cs.AI 06.03.2026 05:00

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> <p>Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen.</p> <p>Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI 06.03.2026 05:00

Mehrere Runden, mehr Genauigkeit: MA‑RAG verbessert medizinisches Denken

Large Language Models (LLMs) zeigen großes Potenzial im medizinischen Frage‑Antwort‑Bereich, doch ihre Neigung zu Halluzinationen und veral…

arXiv – cs.AI 05.03.2026 05:00

KI entdeckt neues Wissen: Dynamisches Benchmark für biologische Forschung

Neuste Fortschritte bei Large Language Models (LLMs) zeigen, dass KI-Systeme erstaunliche Möglichkeiten im automatischen Wissensentdecken b…

arXiv – cs.AI 05.03.2026 05:00

IntPro: Intelligenter Proxy-Agent für kontextabhängiges Intent-Understanding

Large Language Models (LLMs) sind heute unverzichtbar für die Zusammenarbeit zwischen Mensch und KI. Ein entscheidender Schritt dabei ist d…

arXiv – cs.AI 05.03.2026 05:00

Sprachmodelle sabotieren sich: Optimierte Prompts führen zu massivem Leistungsverlust

In einer neuen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wurde gezeigt, dass große Sprachmodelle ihre eigene Leistun…

arXiv – cs.AI 05.03.2026 05:00

<p>LLMs im Stil: Neue, leichte Methode zur präzisen Stilsteuerung</p> <p>Die Steuerung von Stilmerkmalen in großen Sprachmodellen (LLMs) ist seit langem ein schwieriges Problem. Traditionelle Ansätze setzen entweder auf komplexe Prompt-Engineering-Strategien oder auf nachträgliche Ausrichtungsprozesse, die viel Rechenaufwand erfordern. In einer kürzlich veröffentlichten Studie wird ein völlig anderer Ansatz verfolgt: die Analyse der internen Repräsentationen der Modelle.</p> <p>Die Autoren gehen davon aus,

arXiv – cs.AI 05.03.2026 05:00

Automatisierte Konzeptentdeckung deckt versteckte LLM‑Vorlieben auf

In einer wegweisenden Studie wurden Methoden zur automatischen Konzeptentdeckung auf Embedding‑Ebene untersucht, um die Vorlieben von Large…

arXiv – cs.AI 05.03.2026 05:00

Fine‑Tuning: Sprachmodelle werden sensorisch präziser

Large Language Models (LLMs) zeigen ein deutliches „Embodiment‑Gap“, denn ihre textbasierten Repräsentationen stimmen nicht mit menschliche…

arXiv – cs.AI 05.03.2026 05:00

Neues Benchmark RealPref prüft, wie LLMs langfristig Nutzerpräferenzen folgen

Large Language Models (LLMs) werden immer häufiger als persönliche Assistenten eingesetzt, wobei Nutzer ihre komplexen und vielfältigen Prä…

arXiv – cs.AI 05.03.2026 05:00

SpatialText: Text-basiertes Benchmark für räumliches Verständnis großer Modelle

Die 3D-Visualisierung von Gebäuden ist ein wichtiger Bestandteil der Architektur und des Bauwesens. Sie ermöglicht es Architekten, Ingenieu…

arXiv – cs.AI 04.03.2026 05:00

<h1>LLM-gestützte Schiffswegvorhersage: ShipTraj‑R1 setzt neue Maßstäbe</h1> <p>Durch die jüngsten Fortschritte im Bereich der Verstärkungsoptimierung von Sprachmodellen hat sich die Fähigkeit großer Sprachmodelle (LLMs) zur logischen Problemlösung deutlich verbessert. Besonders die Methode des Group Relative Policy Optimization (GRPO) hat in verschiedenen Anwendungsfeldern starke Ergebnisse erzielt.</p> <p>Die Anwendung von LLMs auf die Vorhersage von Schiffsrouten blieb bislang weitgehend unerforscht. In

arXiv – cs.AI 04.03.2026 05:00

Logit-basierte Unsicherheitsmessung verbessert Vertrauen in VLMs für Histopathologie

Vision‑Language‑Modelle (VLMs) haben in nahezu allen Bereichen – von Bildung über Transport bis hin zu Gesundheit – beeindruckende Erfolge…

arXiv – cs.LG 05.03.2026 05:00

MUSE: Plattform für multimodale Sicherheitsbewertung großer Sprachmodelle

Die Sicherheit von großen Sprachmodellen (LLMs) wird bislang überwiegend in Textform geprüft, während multimodale Eingaben wie Audio, Bild…

arXiv – cs.LG 04.03.2026 05:00

CUDABench: Neuer Benchmark für LLMs bei Text-zu-CUDA-Generierung

In einer wegweisenden Veröffentlichung präsentiert das Forschungsteam CUDABench, einen umfassenden Benchmark, der die Fähigkeit von Large L…

arXiv – cs.LG 04.03.2026 05:00

Vision‑Language‑Modelle revolutionieren multimodale Knowledge‑Graph‑Embeddings

Ein neues arXiv‑Paper (2603.02435v1) präsentiert die Vision‑Language Knowledge Graph Embeddings (VL‑KGE), ein innovatives Framework, das di…

arXiv – cs.AI 04.03.2026 05:00

BehaveSim: Neue Methode zur Messung algorithmischer Ähnlichkeit mit LLMs

Die Entwicklung von Algorithmen durch Large Language Models (LLMs) hat die Art und Weise, wie wir Software schreiben, revolutioniert. Im Ge…

arXiv – cs.AI 04.03.2026 05:00

MedFeat: KI-gestützte Feature Engineering für klinische Tabellendaten

In der Analyse klinischer Tabellendaten übertreffen klassische Modelle mit gezielter Feature Engineering häufig neuronale Netzwerke. Durch…

arXiv – cs.LG 04.03.2026 05:00

Kontaminationserkennung ohne Memorierung: Output-Verteilung bei kleinen Modellen

Eine neue Studie aus dem arXiv-Repository zeigt, dass die Methode der Kontaminationserkennung über die Ausgabeverteilung (CDD) bei kleinen…

arXiv – cs.AI 04.03.2026 05:00

LLM-basiertes Argument Mining trifft Logik: Ansatz für Debattenanalyse

Large Language Models (LLMs) haben in der Textanalyse und -generierung bemerkenswerte Erfolge erzielt, doch sie stoßen bei komplexen Diskur…

arXiv – cs.AI 04.03.2026 05:00

Stabile und effiziente QLoRA-Fine‑Tuning‑Pipeline mit Unsloth für große Sprachmodelle

In einem neuen Tutorial wird gezeigt, wie man ein großes Sprachmodell mit Unsloth und QLoRA effizient feinabstimmt. Der Fokus liegt dabei a…

MarkTechPost 03.03.2026 22:29

<h1>LLMs optimieren Hochfrequente Entscheidungen: Normalisierte Belohnungsstrategie</h1> <p>Large Language Models (LLMs) sind das Rückgrat moderner Agenten für sequenzielle Entscheidungen, doch ihre Leistungsfähigkeit lässt bei hochfrequenten Aufgaben nach. In der Regel konzentriert sich die Forschung auf diskrete, eingebettete Szenarien mit seltenen, stark semantisch unterschiedlichen Zuständen – etwa bei der Hausplanung. Solche Ansätze zeigen bei Aufgaben, bei denen sich numerische Zustände ständig, aber

arXiv – cs.AI 04.03.2026 05:00

DIVA‑GRPO: Mehrschichtige Logik mit anpassbarer Schwierigkeitsstufe

Reinforcement‑Learning‑Modelle, die auf Group Relative Policy Optimization (GRPO) setzen, haben sich als effektive Methode etabliert, um di…

arXiv – cs.AI 03.03.2026 05:00