Suche nach Mistral | meineki.news

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

In einer neuen Studie wird die bisherige Symmetrie im Transformer‑Attention‑Mechanismus in Frage gestellt. Während klassische Modelle diese…

arXiv – cs.LG 06.03.2026 05:00

Forschung

AgentAssay: Kostenreduktion von bis zu 100 % bei Regressionstests von KI-Agenten

Autonome KI‑Agenten werden heute in einem noch nie dagewesenen Ausmaß eingesetzt, doch bislang fehlt eine systematische Methode, um sicherz…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Neue Bewertungsmethode deckt versteckte Fehler bei KI-Agenten auf

In hochriskanten Einsatzbereichen werden KI‑Agenten, die auf großen Sprachmodellen (LLMs) basieren, immer häufiger eingesetzt. Bisher messe…

arXiv – cs.AI 04.03.2026 05:00

Forschung

Energie-Leckagen in Sprachmodellen: Neue Methode erkennt Halluzinationen

Ein neues Papier von arXiv (2602.18671v1) präsentiert eine innovative Sichtweise auf die Softmax‑Klassifikation von LLMs als Energie‑basier…

arXiv – cs.AI 24.02.2026 05:00

Forschung

Gewichtsfelder ohne Interferenz: Verluste bei LLM‑Erweiterungen vermeiden

In einer neuen Studie von ArXiv (2602.18628v1) wird ein innovatives Konzept vorgestellt, das die klassische Idee fester Gewichtvektoren in…

arXiv – cs.LG 24.02.2026 05:00

Forschung

KI und Wissensgraphen verbinden menschliche Intentionen mit Maschinen

Ein neues Forschungsdokument aus dem Bereich der intelligenten Fertigung präsentiert einen wegweisenden Ansatz, der die Brücke zwischen men…

arXiv – cs.AI 16.02.2026 05:00

Forschung

AgentLeak: Benchmark deckt massive Datenschutzlücken in Multi-Agent-LLM-Systemen auf

Ein neues Benchmark-Tool namens AgentLeak hat die Schwachstellen von Multi-Agent-LLM-Systemen aufgedeckt, die bisher von herkömmlichen Prüf…

arXiv – cs.AI 13.02.2026 05:00

Forschung

HiFloat4: Neues Floating-Point-Format steigert Genauigkeit bei Sprachmodellen

In einer kürzlich veröffentlichten Arbeit auf arXiv (2602.11287v1) stellt das Forschungsteam das neue HiFloat4 (HiF4)-Format vor – ein bloc…

arXiv – cs.LG 13.02.2026 05:00

Forschung

Das Condensate-Theorem: Transformer-Modelle laufen linear, nicht quadratisch

In einer neuen Veröffentlichung auf arXiv (2602.06317v1) wird das Condensate-Theorem vorgestellt, das zeigt, dass die Sparsität der Aufmerk…

arXiv – cs.LG 09.02.2026 05:00

Forschung

Medizinische LLMs bewerten Augenpatientenfragen – Studie zeigt Unterschiede

In einer aktuellen Untersuchung wurden vier kleine, medizinisch spezialisierte Sprachmodelle – Meerkat‑7B, BioMistral‑7B, OpenBioLLM‑8B und…

arXiv – cs.AI 06.02.2026 05:00

Praxis

Mistral AI stellt Voxtral Transcribe 2 vor: Batch- und Echtzeit-Spracherkennung

Mistral AI hat die neue Produktfamilie Voxtral Transcribe 2 vorgestellt, die automatische Spracherkennung (ASR) für mehrsprachige Produktio…

MarkTechPost 05.02.2026 07:36

Forschung

CoS: Dynamisches Routing für LLMs steigert Genauigkeit um 65 % bei bAbI

Ein neues Framework namens Chain of Simulation (CoS) hat die Art und Weise, wie große Sprachmodelle (LLMs) komplexe Aufgaben lösen, revolut…

arXiv – cs.AI 04.02.2026 05:00

Aktuell

Mistral liefert ultra-schnelles Übersetzungsmodell – Konkurrenz für große AI-Labs

Mistral hat ein neues Übersetzungsmodell vorgestellt, das laut eigenen Angaben die Geschwindigkeit von bestehenden Systemen deutlich übertr…

Wired – AI (Latest) 04.02.2026 15:32

Forschung

RAP: Kompression des KV-Caches durch RoPE‑ausgerichtetes Pruning

In der neuesten Veröffentlichung auf arXiv (2602.02599v1) wird ein innovativer Ansatz vorgestellt, der die Speicher- und Rechenkosten von K…

arXiv – cs.LG 04.02.2026 05:00

Aktuell

Der entscheidende erste Schritt zur erfolgreichen Gestaltung von Unternehmens‑AI

Viele Unternehmen sind in die Welt der generativen KI eingestürmt, nur um festzustellen, dass Pilotprojekte kaum Mehrwert liefern. Heute ve…

MIT Technology Review – Artificial Intelligence 02.02.2026 14:20

Forschung

<p>DPO-Optimierung zeigt Phasenwechsel: Logikleistung schwankt mit β</p> <p>In einer neuen Studie wurde die Direct Preference Optimization (DPO) für drei 7‑B‑Modelle mit offenen Gewichten systematisch untersucht. Dabei wurde der Parameter β, der die Ausrichtung der Modelle steuert, in feinen Schritten variiert, um die Auswirkungen auf die Logikfähigkeit zu beobachten.</p> <p>Bei Mistral zeigte sich ein starkes, nicht‑monotones Verhalten: Die Logikmarge wird nur in einem engen Bereich um β ≈ 10⁻² positiv, au

arXiv – cs.LG 27.01.2026 05:00

Forschung

KI-Modelle zeigen regionalen Bias – Studie deckt große Unterschiede auf

Eine neue Untersuchung aus dem arXiv-Repository beleuchtet, wie stark große Sprachmodelle (LLMs) regionale Vorlieben aufweisen. Das Thema g…

arXiv – cs.AI 26.01.2026 05:00

Forschung

LLMs liefern präzise Gegenfaktische Interventionen für digitale Gesundheit

In einer wegweisenden Studie wird gezeigt, wie große Sprachmodelle (LLMs) gezielt Gegenfaktische Erklärungen (CFEs) erzeugen können, die so…

arXiv – cs.LG 22.01.2026 05:00

Forschung

AGGC: Adaptive Group Gradient Clipping stabilisiert Sprachmodelltraining

In der Welt der großen Sprachmodelle (LLMs) ist das Training oft von explosiven Gradienten begleitet, die das Lernen stören. Um diesem Prob…

arXiv – cs.LG 21.01.2026 05:00

Forschung

<h1>LLMs enthüllen unterschätzte Vertrauenssignale – fundierte Erkenntnisse</h1> <p>Eine neue Studie zeigt, dass moderne Sprachmodelle wie Llama 3.1, Qwen 2.5 und Mistral bereits ohne gezielte Anweisungen psychologisch relevante Vertrauenssignale in ihren Antworten verankern. Diese Entdeckung legt nahe, dass die Vertrauenswürdigkeit von KI‑Systemen bereits im Pre‑Training‑Prozess entsteht.</p> <p>Die Forscher nutzten das PEACE‑Reviews‑Datensatz, der Web‑ähnliche Texte mit Bewertungen zu kognitiven Einschätz

arXiv – cs.AI 19.01.2026 05:00

Forschung

LLM-Fine‑Tuning: Phishing‑Erkennung zeigt Architekturabhängige Generalisierung

In einer neuen Studie wurden die neuesten Sprachmodelle – Llama 3.1 8B, Gemma 2 9B und Mistral – auf die anspruchsvolle Aufgabe der Phishin…

arXiv – cs.AI 16.01.2026 05:00

Aktuell

Wikipedia schließt KI-Trainingsverträge mit Microsoft, Meta und Amazon

Wikimedia Enterprise hat neue Verträge für KI-Trainingsdaten mit fünf großen Technologieunternehmen abgeschlossen. Die Vereinbarungen umfas…

Ars Technica – AI 15.01.2026 15:25

Forschung

Cluster‑Planung mit LLMs: Natürliche Sprache für Soft‑Affinität

In einer neuen Studie wird gezeigt, wie große Sprachmodelle (LLMs) die Zuweisung von Arbeitslasten in Cluster‑Umgebungen vereinfachen könne…

arXiv – cs.AI 15.01.2026 05:00

Forschung

AIConfigurator: Blitzschnelle LLM-Serving-Optimierung über mehrere Frameworks

Die Optimierung von Large Language Model (LLM)-Inference in Produktionsumgebungen wird immer komplexer. Dynamische Arbeitslasten, strenge L…

arXiv – cs.LG 13.01.2026 05:00

Forschung

Neues RAGsemble-Framework verbessert Extraktion von Industrie-Teilspezifikationen

In einer wegweisenden Studie präsentiert ein neues Retrieval‑Augmented Multi‑LLM Ensemble, das die Extraktion von Teilspezifikationen aus u…

arXiv – cs.AI 12.01.2026 05:00

Aktuell

Tesco schließt dreijähriges KI-Partnerschaftsverhältnis zur Kundenorientierung

Tesco hat einen dreijährigen Vertrag mit dem französischen KI-Startup Mistral AI abgeschlossen, um die Kundenerfahrung zu verbessern. Das A…

AI News (TechForge) 22.12.2025 10:00

Forschung

AlignMerge: Geometrisch sicheres Zusammenführen von Sprachmodellen

Das Zusammenführen mehrerer feinabgestimmter Sprachmodelle ist ein beliebter Ansatz, um neue Fähigkeiten zu kombinieren, ohne jedes Mal neu…

arXiv – cs.AI 19.12.2025 05:00

Praxis

Mistral AI stellt OCR 3 vor: Modell für strukturierte Dokumentenverarbeitung

Mistral AI hat sein neuestes OCR-Modell, Mistral OCR 3, vorgestellt. Das Modell, unter dem Namen mistral-ocr-2512 bekannt, ist speziell daf…

MarkTechPost 19.12.2025 19:26

Aktuell

Mistral präsentiert OCR 3: 74 % Erfolgsquote, 2 $ pro 1.000 Seiten

Mistral AI, das französische KI-Unternehmen mit einem Marktwert von 11,7 Milliarden Euro, hat am Dienstag sein neuestes Produkt, das OCR 3…

VentureBeat – AI 17.12.2025 14:00

Forschung

Neue Gewichtungsstrategien verbessern Präferenzoptimierung von LLMs

Fine‑Tuning ist ein wesentlicher Schritt, um große Sprachmodelle (LLMs) an menschliche Präferenzen anzupassen. Das neue Verfahren Multiple‑…

arXiv – cs.LG 12.12.2025 05:00

Finde Modelle, Firmen und Themen

Transformer-Keys verkleinern: Low-Dimensional Attention spart Speicher

AgentAssay: Kostenreduktion von bis zu 100 % bei Regressionstests von KI-Agenten

**Neue Bewertungsmethode deckt versteckte Fehler bei KI-Agenten auf**

Energie-Leckagen in Sprachmodellen: Neue Methode erkennt Halluzinationen

Gewichtsfelder ohne Interferenz: Verluste bei LLM‑Erweiterungen vermeiden

KI und Wissensgraphen verbinden menschliche Intentionen mit Maschinen

AgentLeak: Benchmark deckt massive Datenschutzlücken in Multi-Agent-LLM-Systemen auf

HiFloat4: Neues Floating-Point-Format steigert Genauigkeit bei Sprachmodellen

Das Condensate-Theorem: Transformer-Modelle laufen linear, nicht quadratisch

Medizinische LLMs bewerten Augenpatientenfragen – Studie zeigt Unterschiede

Mistral AI stellt Voxtral Transcribe 2 vor: Batch- und Echtzeit-Spracherkennung

CoS: Dynamisches Routing für LLMs steigert Genauigkeit um 65 % bei bAbI

Mistral liefert ultra-schnelles Übersetzungsmodell – Konkurrenz für große AI-Labs

RAP: Kompression des KV-Caches durch RoPE‑ausgerichtetes Pruning

Der entscheidende erste Schritt zur erfolgreichen Gestaltung von Unternehmens‑AI

KI-Modelle zeigen regionalen Bias – Studie deckt große Unterschiede auf

LLMs liefern präzise Gegenfaktische Interventionen für digitale Gesundheit

AGGC: Adaptive Group Gradient Clipping stabilisiert Sprachmodelltraining

LLM-Fine‑Tuning: Phishing‑Erkennung zeigt Architekturabhängige Generalisierung

Wikipedia schließt KI-Trainingsverträge mit Microsoft, Meta und Amazon

Cluster‑Planung mit LLMs: Natürliche Sprache für Soft‑Affinität

AIConfigurator: Blitzschnelle LLM-Serving-Optimierung über mehrere Frameworks

Neues RAGsemble-Framework verbessert Extraktion von Industrie-Teilspezifikationen

Tesco schließt dreijähriges KI-Partnerschaftsverhältnis zur Kundenorientierung

AlignMerge: Geometrisch sicheres Zusammenführen von Sprachmodellen

Mistral AI stellt OCR 3 vor: Modell für strukturierte Dokumentenverarbeitung

Mistral präsentiert OCR 3: 74 % Erfolgsquote, 2 $ pro 1.000 Seiten

Neue Gewichtungsstrategien verbessern Präferenzoptimierung von LLMs

🍪 Cookie-Einstellungen

AgentAssay: Kostenreduktion von bis zu 100 % bei Regressionstests von KI-Agenten

Neue Bewertungsmethode deckt versteckte Fehler bei KI-Agenten auf

CoS: Dynamisches Routing für LLMs steigert Genauigkeit um 65 % bei bAbI

Mistral präsentiert OCR 3: 74 % Erfolgsquote, 2 $ pro 1.000 Seiten