Suche nach Große Sprachmodelle

<p>DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 %</p> <p>In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar.</p> <p>Der D

arXiv – cs.AI 06.03.2026 05:00

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuste Fortschritte im Zero-Shot-Kommonsense-Reasoning haben vortrainierte Sprachmodelle (PLMs) dazu befähigt, umfangreiches Allgemeinwisse…

arXiv – cs.AI 06.03.2026 05:00

Forschung

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

Ein neues arXiv-Papier (2603.04741v1) präsentiert CONE, ein hybrides Transformer‑Encoder-Modell, das speziell dafür entwickelt wurde, numer…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Neues Forschungspapier aus dem arXiv-Repository zeigt, dass große Sprachmodelle (LLMs) zwar bei vollständigen Informationen in einem einzig…

arXiv – cs.AI 06.03.2026 05:00

Forschung

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> <p>Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen.</p> <p>Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI 06.03.2026 05:00

Forschung

MedCoRAG: Durchsichtige Leberdiagnose mit kollaborativem Retrieval und Konsens

Die präzise und nachvollziehbare Diagnose von Lebererkrankungen ist von entscheidender Bedeutung, stellt jedoch in der Praxis weiterhin ein…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLMs im Überlebenskampf: Risikoanalyse von gefährlichen Verhaltensweisen

Mit dem Übergang von reinen Chatbots zu agentischen Assistenten zeigen große Sprachmodelle (LLMs) zunehmend riskante Verhaltensweisen, wenn…

arXiv – cs.AI 06.03.2026 05:00

Forschung

BioLLMAgent: Hybrid vereint Interpretierbarkeit und realistische Entscheidungen

In der Computational Psychiatry besteht seit langem ein Spannungsfeld zwischen Modellen, die leicht zu verstehen sind, und solchen, die men…

arXiv – cs.AI 06.03.2026 05:00

Forschung

<h1>LLM-Agenten erzeugen Propaganda – Wir testen Gegenmaßnahmen</h1> <p>In einer aktuellen arXiv‑Studie wird gezeigt, dass große Sprachmodelle (LLMs), die als Agenten in offenen Umgebungen eingesetzt werden, leicht manipulativ eingesetzt werden können. Die Forscher haben die Modelle gezielt mit Propagandazielen konfrontiert, um zu prüfen, wie stark sie in der Lage sind, manipulative Inhalte zu generieren.</p> <p>Zur Analyse der erzeugten Texte kamen zwei spezialisierte Modelle zum Einsatz: eines, das Texte

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLM-System beschleunigt GNN-Inferenz auf großen Wissensgraphen um 28-fach

Ein neues Verfahren namens KG-WISE nutzt große Sprachmodelle (LLMs), um Graph Neural Networks (GNNs) effizienter auf riesigen Wissensgraphe…

arXiv – cs.LG 06.03.2026 05:00

Forschung

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

In der jüngsten Forschung zum In‑Context‑Learning zeigen große Sprachmodelle, dass selbst ein einziges fehlerhaftes Beispiel in einer Demon…

arXiv – cs.LG 06.03.2026 05:00

Forschung

KI für Landwirtschaft: Feinabgestimmtes Modell liefert präzise, sichere Beratung

In einer wegweisenden Studie zeigen Forscher, dass große Sprachmodelle (LLMs) das Potenzial besitzen, Landwirte mit maßgeschneiderter Berat…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Neues neurosymbolisches Verfahren verschiebt Erzählungen effizienter als LLMs

Die Kunst der wirkungsvollen Kommunikation hängt stark davon ab, wie gut eine Botschaft mit der Erzählweise und Weltanschauung des Publikum…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Sprachmodelle sabotieren sich: Optimierte Prompts führen zu massivem Leistungsverlust

In einer neuen Studie von Forschern aus dem Bereich der künstlichen Intelligenz wurde gezeigt, dass große Sprachmodelle ihre eigene Leistun…

arXiv – cs.AI 05.03.2026 05:00

Forschung

MMAI Gym: Mit Liquid Foundation Models die Wirkstoffforschung revolutionieren

Ein neues arXiv‑Paper präsentiert das MMAI Gym for Science, ein umfassendes Toolkit, das große Sprachmodelle gezielt auf die Sprache der Mo…

arXiv – cs.LG 05.03.2026 05:00

Forschung

<h1>LLMs wählen Ziele anders als Menschen – Forschung warnt vor Ersatz</h1> <p>Eine neue Studie von Forschern auf arXiv zeigt, dass große Sprachmodelle (LLMs) bei der Auswahl von Zielen in offenen Aufgaben deutlich von menschlichem Verhalten abweichen.</p> <p>Die Untersuchung testete vier Top-Modelle – GPT‑5, Gemini 2.5 Pro, Claude Sonnet 4.5 und Centaur – in einem kontrollierten Lernexperiment, das aus der Kognitionswissenschaft stammt.</p> <p>Während Menschen allmählich verschiedene Ziele erkunden und dab

arXiv – cs.AI 05.03.2026 05:00

Forschung

MASS: LLMs adaptieren selbstständig mit synthetischen Trainingsdaten

Große Sprachmodelle (LLMs) sind starke Allzweck-Reasoner, die in vielen unterschiedlichen Domänen und Aufgaben eingesetzt werden. Damit sie…

arXiv – cs.LG 05.03.2026 05:00

Forschung

Personality‑Slider für LLMs: Steuerung von Charaktereigenschaften in Echtzeit

Eine neue Technik ermöglicht es, große Sprachmodelle (LLMs) in Echtzeit mit individuellen Persönlichkeiten zu versehen, ohne dass dafür umf…

arXiv – cs.AI 05.03.2026 05:00

Forschung

DEVS-Formalismus ermöglicht KI-generierte, überprüfbare Weltmodelle

Weltmodelle sind entscheidend für Planung und Bewertung von agentenbasierten Systemen. Bisher stehen zwei extreme Ansätze zur Verfügung: ha…

arXiv – cs.AI 05.03.2026 05:00

Forschung

PlugMem: Aufgabenunabhängiges Speicher-Plugin für LLM-Agenten

Langfristiges Gedächtnis ist für große Sprachmodelle (LLM), die in komplexen Umgebungen arbeiten, unverzichtbar. Bisherige Speicherlösungen…

arXiv – cs.AI 05.03.2026 05:00

Forschung

DIALEVAL: Automatisierte Typentheoretische Bewertung von LLM‑Anweisungen

Die Bewertung, wie gut große Sprachmodelle (LLMs) Befehle ausführen, ist bislang stark von manueller Annotation und einheitlichen Kriterien…

arXiv – cs.AI 05.03.2026 05:00

Forschung

REGAL: Architektur für deterministische KI-Integration in Unternehmens‑Telemetrie

In modernen Unternehmens‑Engineering‑Organisationen entstehen täglich riesige Mengen heterogener Telemetrie‑Daten aus Versionskontrollsyste…

arXiv – cs.AI 04.03.2026 05:00

Forschung

RAPO: Erkundung von LLM-Agenten durch Retrieval‑gestützte Optimierung

Agentic Reinforcement Learning (Agentic RL) hat das Potenzial, große Sprachmodelle (LLM) zu leistungsstarken Agenten zu machen, die komplex…

arXiv – cs.AI 04.03.2026 05:00

Forschung

TikZilla: KI erzeugt hochwertige TikZ-Programme mit großen Daten und RL

Wissenschaftler nutzen immer häufiger große Sprachmodelle, um komplexe Grafiken aus Textbeschreibungen zu generieren. Dabei kommt TikZ – ei…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Neues ERI-Benchmark: 57.750 Aufgaben für Ingenieur-LLMs

Ein brandneues Benchmark-Dataset namens Engineering Reasoning and Instruction (ERI) wurde veröffentlicht, das speziell dafür entwickelt wur…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Bayessches Multi-Agent-Framework revolutioniert Low-Code-Plattform für Wissenschaft

Eine neue Low‑Code-Plattform für die Wissenschaft, die auf einem bayesschen, adversarialen Multi‑Agenten‑Framework basiert, wurde auf arXiv…

arXiv – cs.AI 04.03.2026 05:00

Forschung

<p>LLM-MLFFN: Mehrschichtige Fusion von Fahrverhalten für autonome Fahrzeuge</p> <p>Ein neues Modell namens LLM-MLFFN nutzt große Sprachmodelle, um die Klassifizierung von Fahrverhalten autonomer Fahrzeuge zu verbessern. Durch die Kombination von numerischen Zeitreihen und semantischen Beschreibungen aus vortrainierten Sprachmodellen wird die Interpretierbarkeit und Robustheit in komplexen Verkehrsszenarien deutlich erhöht.</p> <p>Das System besteht aus drei Hauptkomponenten: Erstens extrahiert ein mehrschi

arXiv – cs.AI 04.03.2026 05:00

Forschung

SAE: Erklärbare Merkmale prognostizieren LLM-Übertragbarkeit ohne Training

In den letzten Jahren haben vortrainierte große Sprachmodelle in einer Vielzahl von Aufgaben beeindruckende Erfolge erzielt. Doch ihr wirkl…

arXiv – cs.AI 04.03.2026 05:00

Praxis

<p>TorchAO erweitert Quantization‑Aware Training für Edge‑LLMs</p> <p>In unserem letzten Blog‑Post haben wir den ersten Quantization‑Aware Training‑Flow (QAT) in TorchAO vorgestellt, der große Sprachmodelle für Edge‑Geräte mit ExecuTorch optimiert. Dieser Ansatz ermöglicht es, Modelle auf kleineren Plattformen einzusetzen, ohne dabei die Genauigkeit zu stark zu beeinträchtigen.</p> <p>Seitdem haben wir den Flow weiterentwickelt und zusätzliche Optimierungen integriert. Die neue Version unterstützt nun erwei

PyTorch – Blog 04.03.2026 17:10

Praxis

Stabile und effiziente QLoRA-Fine‑Tuning‑Pipeline mit Unsloth für große Sprachmodelle

In einem neuen Tutorial wird gezeigt, wie man ein großes Sprachmodell mit Unsloth und QLoRA effizient feinabstimmt. Der Fokus liegt dabei a…

MarkTechPost 03.03.2026 22:29

Finde Modelle, Firmen und Themen

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

MedCoRAG: Durchsichtige Leberdiagnose mit kollaborativem Retrieval und Konsens

LLMs im Überlebenskampf: Risikoanalyse von gefährlichen Verhaltensweisen

BioLLMAgent: Hybrid vereint Interpretierbarkeit und realistische Entscheidungen

LLM-System beschleunigt GNN-Inferenz auf großen Wissensgraphen um 28-fach

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

KI für Landwirtschaft: Feinabgestimmtes Modell liefert präzise, sichere Beratung

Neues neurosymbolisches Verfahren verschiebt Erzählungen effizienter als LLMs

Sprachmodelle sabotieren sich: Optimierte Prompts führen zu massivem Leistungsverlust

MMAI Gym: Mit Liquid Foundation Models die Wirkstoffforschung revolutionieren

MASS: LLMs adaptieren selbstständig mit synthetischen Trainingsdaten

Personality‑Slider für LLMs: Steuerung von Charaktereigenschaften in Echtzeit

DEVS-Formalismus ermöglicht KI-generierte, überprüfbare Weltmodelle

PlugMem: Aufgabenunabhängiges Speicher-Plugin für LLM-Agenten

DIALEVAL: Automatisierte Typentheoretische Bewertung von LLM‑Anweisungen

REGAL: Architektur für deterministische KI-Integration in Unternehmens‑Telemetrie

RAPO: Erkundung von LLM-Agenten durch Retrieval‑gestützte Optimierung

TikZilla: KI erzeugt hochwertige TikZ-Programme mit großen Daten und RL

Neues ERI-Benchmark: 57.750 Aufgaben für Ingenieur-LLMs

Bayessches Multi-Agent-Framework revolutioniert Low-Code-Plattform für Wissenschaft

SAE: Erklärbare Merkmale prognostizieren LLM-Übertragbarkeit ohne Training

Stabile und effiziente QLoRA-Fine‑Tuning‑Pipeline mit Unsloth für große Sprachmodelle

🍪 Cookie-Einstellungen

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation