KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “language model”

Google präsentiert Android Bench – neues LLM-Benchmark für Android

Google hat Android Bench veröffentlicht, ein neues Leaderboard und Evaluationsframework, das speziell darauf abzielt, die Leistung von Larg…

MarkTechPost 06.03.2026 19:53

<p>DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 %</p> <p>In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar.</p> <p>Der D

arXiv – cs.AI 06.03.2026 05:00

VISA: Präzise Werteanpassung von LLMs ohne Qualitätsverlust

Ein neues Verfahren namens VISA (Value Injection via Shielded Adaptation) verspricht, Large Language Models (LLMs) genauer an menschliche W…

arXiv – cs.AI 06.03.2026 05:00

Automatisierte Datenauswertung: KI-gestütztes Risikobewertungs-Framework

Large Language Models (LLMs) werden zunehmend in kritische Entscheidungsprozesse eingebunden, was die Nachfrage nach zuverlässiger und auto…

arXiv – cs.AI 06.03.2026 05:00

K-Gen: Sprachmodell für interpretierbare Trajektorien in autonomen Fahrsimulation

In der autonomen Fahrsimulation steht die Erzeugung realistischer und vielfältiger Fahrtrajektorien im Fokus. K-Gen, ein multimodales Sprac…

arXiv – cs.AI 06.03.2026 05:00

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> <p>Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen.</p> <p>Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI 06.03.2026 05:00

Neue Methode beschleunigt Diffusions‑Sprachmodelle ohne Qualitätsverlust

Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz hat einen innovativen Ansatz vorgestellt, der die Textgenerierung v…

arXiv – cs.AI 06.03.2026 05:00

Mehrere Runden, mehr Genauigkeit: MA‑RAG verbessert medizinisches Denken

Large Language Models (LLMs) zeigen großes Potenzial im medizinischen Frage‑Antwort‑Bereich, doch ihre Neigung zu Halluzinationen und veral…

arXiv – cs.AI 05.03.2026 05:00

KI entdeckt neues Wissen: Dynamisches Benchmark für biologische Forschung

Neuste Fortschritte bei Large Language Models (LLMs) zeigen, dass KI-Systeme erstaunliche Möglichkeiten im automatischen Wissensentdecken b…

arXiv – cs.AI 05.03.2026 05:00

Quantum‑inspiriertes Self‑Attention steigert GPT‑1‑Leistung um 15,5‑fach

In den letzten Jahren haben transformerbasierte Modelle die Entwicklung der natürlichen Sprachverarbeitung maßgeblich vorangetrieben. Dabei…

arXiv – cs.AI 05.03.2026 05:00

IntPro: Intelligenter Proxy-Agent für kontextabhängiges Intent-Understanding

Large Language Models (LLMs) sind heute unverzichtbar für die Zusammenarbeit zwischen Mensch und KI. Ein entscheidender Schritt dabei ist d…

arXiv – cs.AI 05.03.2026 05:00

Sprachmodelle sabotieren sich: Optimierte Prompts führen zu massivem Leistungsverlust

In einer neuen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wurde gezeigt, dass große Sprachmodelle ihre eigene Leistun…

arXiv – cs.AI 05.03.2026 05:00

<p>LLMs im Stil: Neue, leichte Methode zur präzisen Stilsteuerung</p> <p>Die Steuerung von Stilmerkmalen in großen Sprachmodellen (LLMs) ist seit langem ein schwieriges Problem. Traditionelle Ansätze setzen entweder auf komplexe Prompt-Engineering-Strategien oder auf nachträgliche Ausrichtungsprozesse, die viel Rechenaufwand erfordern. In einer kürzlich veröffentlichten Studie wird ein völlig anderer Ansatz verfolgt: die Analyse der internen Repräsentationen der Modelle.</p> <p>Die Autoren gehen davon aus,

arXiv – cs.AI 05.03.2026 05:00

<h1>LLMs wählen Ziele anders als Menschen – Forschung warnt vor Ersatz</h1> <p>Eine neue Studie von Forschern auf arXiv zeigt, dass große Sprachmodelle (LLMs) bei der Auswahl von Zielen in offenen Aufgaben deutlich von menschlichem Verhalten abweichen.</p> <p>Die Untersuchung testete vier Top-Modelle – GPT‑5, Gemini 2.5 Pro, Claude Sonnet 4.5 und Centaur – in einem kontrollierten Lernexperiment, das aus der Kognitionswissenschaft stammt.</p> <p>Während Menschen allmählich verschiedene Ziele erkunden und dab

arXiv – cs.AI 05.03.2026 05:00

Automatisierte Konzeptentdeckung deckt versteckte LLM‑Vorlieben auf

In einer wegweisenden Studie wurden Methoden zur automatischen Konzeptentdeckung auf Embedding‑Ebene untersucht, um die Vorlieben von Large…

arXiv – cs.AI 05.03.2026 05:00

Fine‑Tuning: Sprachmodelle werden sensorisch präziser

Large Language Models (LLMs) zeigen ein deutliches „Embodiment‑Gap“, denn ihre textbasierten Repräsentationen stimmen nicht mit menschliche…

arXiv – cs.AI 05.03.2026 05:00

Neues Benchmark RealPref prüft, wie LLMs langfristig Nutzerpräferenzen folgen

Large Language Models (LLMs) werden immer häufiger als persönliche Assistenten eingesetzt, wobei Nutzer ihre komplexen und vielfältigen Prä…

arXiv – cs.AI 05.03.2026 05:00

Transformer trennt Sprache & Wissensgraph – neue Joint-Training-Architektur

Eine neue Architektur für Transformer‑Modelle, die sowohl Sätze als auch strukturierte Daten gleichzeitig trainiert, wurde vorgestellt. Das…

arXiv – cs.AI 05.03.2026 05:00

<p>LLM-MLFFN: Mehrschichtige Fusion von Fahrverhalten für autonome Fahrzeuge</p> <p>Ein neues Modell namens LLM-MLFFN nutzt große Sprachmodelle, um die Klassifizierung von Fahrverhalten autonomer Fahrzeuge zu verbessern. Durch die Kombination von numerischen Zeitreihen und semantischen Beschreibungen aus vortrainierten Sprachmodellen wird die Interpretierbarkeit und Robustheit in komplexen Verkehrsszenarien deutlich erhöht.</p> <p>Das System besteht aus drei Hauptkomponenten: Erstens extrahiert ein mehrschi

arXiv – cs.AI 04.03.2026 05:00

SpatialText: Text-basiertes Benchmark für räumliches Verständnis großer Modelle

Die 3D-Visualisierung von Gebäuden ist ein wichtiger Bestandteil der Architektur und des Bauwesens. Sie ermöglicht es Architekten, Ingenieu…

arXiv – cs.AI 04.03.2026 05:00

<h1>LLM-gestützte Schiffswegvorhersage: ShipTraj‑R1 setzt neue Maßstäbe</h1> <p>Durch die jüngsten Fortschritte im Bereich der Verstärkungsoptimierung von Sprachmodellen hat sich die Fähigkeit großer Sprachmodelle (LLMs) zur logischen Problemlösung deutlich verbessert. Besonders die Methode des Group Relative Policy Optimization (GRPO) hat in verschiedenen Anwendungsfeldern starke Ergebnisse erzielt.</p> <p>Die Anwendung von LLMs auf die Vorhersage von Schiffsrouten blieb bislang weitgehend unerforscht. In

arXiv – cs.AI 04.03.2026 05:00

Logit-basierte Unsicherheitsmessung verbessert Vertrauen in VLMs für Histopathologie

Vision‑Language‑Modelle (VLMs) haben in nahezu allen Bereichen – von Bildung über Transport bis hin zu Gesundheit – beeindruckende Erfolge…

arXiv – cs.LG 05.03.2026 05:00

MUSE: Plattform für multimodale Sicherheitsbewertung großer Sprachmodelle

Die Sicherheit von großen Sprachmodellen (LLMs) wird bislang überwiegend in Textform geprüft, während multimodale Eingaben wie Audio, Bild…

arXiv – cs.LG 04.03.2026 05:00

CUDABench: Neuer Benchmark für LLMs bei Text-zu-CUDA-Generierung

In einer wegweisenden Veröffentlichung präsentiert das Forschungsteam CUDABench, einen umfassenden Benchmark, der die Fähigkeit von Large L…

arXiv – cs.LG 04.03.2026 05:00

Vision‑Language‑Modelle revolutionieren multimodale Knowledge‑Graph‑Embeddings

Ein neues arXiv‑Paper (2603.02435v1) präsentiert die Vision‑Language Knowledge Graph Embeddings (VL‑KGE), ein innovatives Framework, das di…

arXiv – cs.AI 04.03.2026 05:00

BehaveSim: Neue Methode zur Messung algorithmischer Ähnlichkeit mit LLMs

Die Entwicklung von Algorithmen durch Large Language Models (LLMs) hat die Art und Weise, wie wir Software schreiben, revolutioniert. Im Ge…

arXiv – cs.AI 04.03.2026 05:00

MedFeat: KI-gestützte Feature Engineering für klinische Tabellendaten

In der Analyse klinischer Tabellendaten übertreffen klassische Modelle mit gezielter Feature Engineering häufig neuronale Netzwerke. Durch…

arXiv – cs.LG 04.03.2026 05:00

Kontaminationserkennung ohne Memorierung: Output-Verteilung bei kleinen Modellen

Eine neue Studie aus dem arXiv-Repository zeigt, dass die Methode der Kontaminationserkennung über die Ausgabeverteilung (CDD) bei kleinen…

arXiv – cs.AI 04.03.2026 05:00

LLM-basiertes Argument Mining trifft Logik: Ansatz für Debattenanalyse

Large Language Models (LLMs) haben in der Textanalyse und -generierung bemerkenswerte Erfolge erzielt, doch sie stoßen bei komplexen Diskur…

arXiv – cs.AI 04.03.2026 05:00

Stabile und effiziente QLoRA-Fine‑Tuning‑Pipeline mit Unsloth für große Sprachmodelle

In einem neuen Tutorial wird gezeigt, wie man ein großes Sprachmodell mit Unsloth und QLoRA effizient feinabstimmt. Der Fokus liegt dabei a…

MarkTechPost 03.03.2026 22:29