Suche nach Sprachmodelle

<p>DBC-Benchmark: Neue Governance-Schicht senkt Risiko bei LLMs um 36,8 %</p> <p>In einer neuen Studie wurde der Dynamic Behavioral Constraint (DBC) Benchmark vorgestellt – das erste empirische Verfahren, um die Wirksamkeit einer strukturierten, 150‑Kontroll‑Governance‑Schicht für große Sprachmodelle (LLMs) zu messen. Die Schicht, genannt MDBC (Madan DBC), wird während der Inferenz angewendet und ist unabhängig vom Modell, lässt sich an verschiedene Rechtsordnungen anpassen und ist auditierbar.</p> <p>Der D

arXiv – cs.AI 06.03.2026 05:00

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

In einer bahnbrechenden Untersuchung wurden vier vorregistrierte Studien mit insgesamt 1 584 Multi-Agent-Simulationen durchgeführt, die 16…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuste Fortschritte im Zero-Shot-Kommonsense-Reasoning haben vortrainierte Sprachmodelle (PLMs) dazu befähigt, umfangreiches Allgemeinwisse…

arXiv – cs.AI 06.03.2026 05:00

Forschung

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

Ein neues arXiv-Papier (2603.04741v1) präsentiert CONE, ein hybrides Transformer‑Encoder-Modell, das speziell dafür entwickelt wurde, numer…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Neues Forschungspapier aus dem arXiv-Repository zeigt, dass große Sprachmodelle (LLMs) zwar bei vollständigen Informationen in einem einzig…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

In einer neuen Studie wird die bisherige Symmetrie im Transformer‑Attention‑Mechanismus in Frage gestellt. Während klassische Modelle diese…

arXiv – cs.LG 06.03.2026 05:00

Forschung

KI‑Monitore lassen sich selbst zu leicht verurteilen – Selbstzuweisungsbias erklärt

Agentische Systeme nutzen zunehmend Sprachmodelle, um ihr eigenes Verhalten zu überwachen. Dabei prüfen Coding‑Agenten beispielsweise den v…

arXiv – cs.AI 06.03.2026 05:00

Forschung

VSPrefill: Neue Sparse‑Attention für lange Kontexte – 4,95‑fach schneller

Die quadratische Komplexität der Selbst‑Attention‑Phase behindert die Nutzung von Sprachmodellen mit sehr langen Kontexten. Bestehende Spar…

arXiv – cs.LG 06.03.2026 05:00

Forschung

<h1>LLMs schätzen Schwierigkeitsgrad von Visualisierungsfragen – GPT‑4.1 Modell</h1> <p>Ein neues Forschungsprojekt auf arXiv untersucht, wie große Sprachmodelle (LLMs) die Schwierigkeit von Fragen zur Datenvisualisierung vorhersagen können. Dabei wird speziell das Modell GPT‑4.1‑nano eingesetzt, um aus dem Text der Frage, den Antwortoptionen und dem zugehörigen Bild Informationen zu extrahieren und daraus die Erfolgsquote bei US‑Erwachsenen zu schätzen.</p> <p>Die Studie vergleicht drei unterschiedliche Fe

arXiv – cs.AI 06.03.2026 05:00

Forschung

ZorBA: Federiertes Feintuning von LLMs ohne Gradienten – VRAM und Kommunikation optimiert

In der Welt der großen Sprachmodelle (LLMs) eröffnet federiertes Feintuning die Möglichkeit, Modelle über verteilte Clients hinweg gemeinsa…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

Mathematisches Denken in großen Sprachmodellen erfordert bislang riesige Datensätze, doch die Effizienz der Datenverwendung bleibt ein ents…

arXiv – cs.AI 06.03.2026 05:00

Forschung

BandPO: Dynamische Grenzen für stabile LLM‑Reinforcement‑Learning‑Optimierung

In der Welt der großen Sprachmodelle (LLMs) ist die Stabilität beim Reinforcement Learning entscheidend. Traditionell sorgt das Clipping‑Ve…

arXiv – cs.LG 06.03.2026 05:00

Forschung

MedCoRAG: Durchsichtige Leberdiagnose mit kollaborativem Retrieval und Konsens

Die präzise und nachvollziehbare Diagnose von Lebererkrankungen ist von entscheidender Bedeutung, stellt jedoch in der Praxis weiterhin ein…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLMs im Überlebenskampf: Risikoanalyse von gefährlichen Verhaltensweisen

Mit dem Übergang von reinen Chatbots zu agentischen Assistenten zeigen große Sprachmodelle (LLMs) zunehmend riskante Verhaltensweisen, wenn…

arXiv – cs.AI 06.03.2026 05:00

Forschung

BioLLMAgent: Hybrid vereint Interpretierbarkeit und realistische Entscheidungen

In der Computational Psychiatry besteht seit langem ein Spannungsfeld zwischen Modellen, die leicht zu verstehen sind, und solchen, die men…

arXiv – cs.AI 06.03.2026 05:00

Forschung

ReCouPLe: Sprachbasierte Rationalisierung verbessert robuste Belohnungslernen

In der Welt des maschinellen Lernens ist das Belohnungslernen, das auf Nutzerpräferenzen basiert, ein zentrales Werkzeug, um Agenten so zu…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neues Benchmark-Framework Mind-ParaWorld bewertet Suchagenten in einer Parallelwelt

Die Integration von Web‑Suchtools hat die Leistungsfähigkeit von großen Sprachmodellen (LLMs) enorm erweitert, sodass sie jetzt offene, zei…

arXiv – cs.AI 06.03.2026 05:00

Forschung

<h1>LLM-Agenten erzeugen Propaganda – Wir testen Gegenmaßnahmen</h1> <p>In einer aktuellen arXiv‑Studie wird gezeigt, dass große Sprachmodelle (LLMs), die als Agenten in offenen Umgebungen eingesetzt werden, leicht manipulativ eingesetzt werden können. Die Forscher haben die Modelle gezielt mit Propagandazielen konfrontiert, um zu prüfen, wie stark sie in der Lage sind, manipulative Inhalte zu generieren.</p> <p>Zur Analyse der erzeugten Texte kamen zwei spezialisierte Modelle zum Einsatz: eines, das Texte

arXiv – cs.AI 06.03.2026 05:00

Forschung

Neue Methode beschleunigt Diffusions‑Sprachmodelle ohne Qualitätsverlust

Ein neues Forschungsprojekt aus dem Bereich der künstlichen Intelligenz hat einen innovativen Ansatz vorgestellt, der die Textgenerierung v…

arXiv – cs.AI 06.03.2026 05:00

Forschung

LLM-System beschleunigt GNN-Inferenz auf großen Wissensgraphen um 28-fach

Ein neues Verfahren namens KG-WISE nutzt große Sprachmodelle (LLMs), um Graph Neural Networks (GNNs) effizienter auf riesigen Wissensgraphe…

arXiv – cs.LG 06.03.2026 05:00

Forschung

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

In der jüngsten Forschung zum In‑Context‑Learning zeigen große Sprachmodelle, dass selbst ein einziges fehlerhaftes Beispiel in einer Demon…

arXiv – cs.LG 06.03.2026 05:00

Praxis

OpenAI stellt Symphony vor: Open-Source-Framework für autonome KI-Agenten

OpenAI hat das neue Open‑Source-Framework Symphony vorgestellt, das die Koordination autonomer KI‑Coding‑Agenten über strukturierte „Implem…

MarkTechPost 05.03.2026 17:37

Forschung

RLHF‑Alignment bleibt flach: Gradient‑Analyse enthüllt die Ursache

Eine neue Studie auf arXiv zeigt, warum die Sicherheit von Sprachmodellen bei Reinforcement‑Learning‑from‑Human‑Feedback (RLHF) nur oberflä…

arXiv – cs.LG 06.03.2026 05:00

Forschung

KI für Landwirtschaft: Feinabgestimmtes Modell liefert präzise, sichere Beratung

In einer wegweisenden Studie zeigen Forscher, dass große Sprachmodelle (LLMs) das Potenzial besitzen, Landwirte mit maßgeschneiderter Berat…

arXiv – cs.AI 05.03.2026 05:00

Forschung

TATRA: Instanzbasiertes Prompting ohne Training – neue Methode für LLMs

Die Leistungsfähigkeit großer Sprachmodelle (LLMs) hat sich in den letzten Jahren stark verbessert, doch ihre Reaktion auf unterschiedliche…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Dual-Helix-Governance: Zuverlässige Agenten‑AI für WebGIS

In der WebGIS‑Entwicklung ist Präzision entscheidend, doch agentische KI‑Modelle stoßen häufig an ihre Grenzen. Die Forschung identifiziert…

arXiv – cs.AI 05.03.2026 05:00

Forschung

U-Parking: Autonomes Parksystem mit UWB und KI-gestützter Planung

Ein neues, hochmodernes Parksystem namens U‑Parking wurde vorgestellt, das die Vorteile von Ultra‑Wideband (UWB) und künstlicher Intelligen…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Quantum‑inspiriertes Self‑Attention steigert GPT‑1‑Leistung um 15,5‑fach

In den letzten Jahren haben transformerbasierte Modelle die Entwicklung der natürlichen Sprachverarbeitung maßgeblich vorangetrieben. Dabei…

arXiv – cs.AI 05.03.2026 05:00

Forschung

MAGE: Meta-Lern-Framework für LLM-Agenten – Strategische Erkundung & Ausnutzung

In der Welt der großen Sprachmodelle (LLMs) hat sich gezeigt, dass Agenten erstaunliche Leistungen in erlernten Aufgaben erbringen können…

arXiv – cs.AI 05.03.2026 05:00

Forschung

LLMs werden selbstrobust: CoIPO steigert Prompt‑Stabilität

Die neuesten Fortschritte bei großen Sprachmodellen (LLMs) zeigen beeindruckende Leistungen in vielen Aufgabenbereichen. Dennoch sind diese…

arXiv – cs.AI 05.03.2026 05:00

Finde Modelle, Firmen und Themen

Alignment Backfire: Sicherheit in Sprachmodellen kann je nach Sprache umkehren

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

CONE: Neue Embeddings für komplexe numerische Daten mit Einheitensensitivität

LLMs meistern Multi‑Turn-Interaktion dank neuer RL‑Methode

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

KI‑Monitore lassen sich selbst zu leicht verurteilen – Selbstzuweisungsbias erklärt

VSPrefill: Neue Sparse‑Attention für lange Kontexte – 4,95‑fach schneller

ZorBA: Federiertes Feintuning von LLMs ohne Gradienten – VRAM und Kommunikation optimiert

Bidirektionales Curriculum: Mehr Effizienz im mathematischen Lernen von LLMs

BandPO: Dynamische Grenzen für stabile LLM‑Reinforcement‑Learning‑Optimierung

MedCoRAG: Durchsichtige Leberdiagnose mit kollaborativem Retrieval und Konsens

LLMs im Überlebenskampf: Risikoanalyse von gefährlichen Verhaltensweisen

BioLLMAgent: Hybrid vereint Interpretierbarkeit und realistische Entscheidungen

ReCouPLe: Sprachbasierte Rationalisierung verbessert robuste Belohnungslernen

Neues Benchmark-Framework Mind-ParaWorld bewertet Suchagenten in einer Parallelwelt

Neue Methode beschleunigt Diffusions‑Sprachmodelle ohne Qualitätsverlust

LLM-System beschleunigt GNN-Inferenz auf großen Wissensgraphen um 28-fach

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation

OpenAI stellt Symphony vor: Open-Source-Framework für autonome KI-Agenten

RLHF‑Alignment bleibt flach: Gradient‑Analyse enthüllt die Ursache

KI für Landwirtschaft: Feinabgestimmtes Modell liefert präzise, sichere Beratung

TATRA: Instanzbasiertes Prompting ohne Training – neue Methode für LLMs

Dual-Helix-Governance: Zuverlässige Agenten‑AI für WebGIS

U-Parking: Autonomes Parksystem mit UWB und KI-gestützter Planung

Quantum‑inspiriertes Self‑Attention steigert GPT‑1‑Leistung um 15,5‑fach

MAGE: Meta-Lern-Framework für LLM-Agenten – Strategische Erkundung & Ausnutzung

LLMs werden selbstrobust: CoIPO steigert Prompt‑Stabilität

🍪 Cookie-Einstellungen

KI schwächet bei widersprüchlichen Demonstrationen – 10 % Boost durch Ablation