Suche nach Calibration | meineki.news

Neuer Ansatz reduziert Bias bei Feature-Attributionen in KI-Modellen

In der KI-Welt sind Erklärungen zu Feature‑Attributionen ein zentrales Thema, doch viele gängige Methoden liefern oft unzuverlässige Wichti…

arXiv – cs.LG 06.03.2026 05:00

Forschung

Verteilungsbasierte Vertrauenskalibrierung verbessert KI-Modelle

In der Welt der großen Sprachmodelle hat die Technik des Test‑Time‑Scalings die Genauigkeit von Vorhersagen deutlich gesteigert, indem mehr…

arXiv – cs.LG 05.03.2026 05:00

Forschung

Router‑Kalibrierung rettet re‑Training‑freie MoE‑Kompression

Die neueste Studie aus dem arXiv‑Repository zeigt, dass die gängige Praxis, Mixture‑of‑Experts‑Modelle ohne erneutes Training zu komprimier…

arXiv – cs.LG 04.03.2026 05:00

Forschung

Metakognitive Entropie-Kalibrierung verbessert verifizierbares RL-Reasoning In den letzten Jahren haben große Rechenmodelle für komplexe Aufgaben, wie Mathematik und Frage‑Antwort‑Systeme, enorme Fortschritte erzielt. Diese Modelle werden meist mit Reinforcement Learning und verifizierbaren Belohnungen (RLVR) trainiert. Dabei wird jedoch fast ausschließlich ein binäres Korrektheitssignal verwendet, während die inhärente Unsicherheit des Modells weitgehend ignoriert wird. Dieses „Uncertainty‑Reward

arXiv – cs.AI 27.02.2026 05:00

Forschung

Neue Methode zertifiziert Zuverlässigkeit von Black-Box‑KI-Agenten

Eine neue Studie aus dem Bereich der künstlichen Intelligenz präsentiert ein Verfahren, mit dem die Zuverlässigkeit von Black‑Box‑KI-System…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Neues Verfahren: Online-Generative Modelle, die nicht falsifizierbar sind

Eine aktuelle Veröffentlichung auf arXiv präsentiert ein innovatives Verfahren namens Defensive Generation, das es ermöglicht, generative M…

arXiv – cs.LG 26.02.2026 05:00

Forschung

Bayessche Stiefel-Adapter: Kalibrierte PEFT für zuverlässige Sprachmodelle

Parameter‑effizientes Fine‑Tuning wie LoRA ermöglicht die praktische Anpassung großer Sprachmodelle, liefert jedoch keine verlässlichen Uns…

arXiv – cs.LG 23.02.2026 05:00

Forschung

P300-BCI-Schreiber: Adaptive Lernmethode reduziert Kalibrierung drastisch

Ein neu entwickeltes P300-ERP-basiertes Brain‑Computer‑Interface (BCI) für die Textschreibung verspricht, die bisher notwendige Kalibrierun…

arXiv – cs.LG 19.02.2026 05:00

Forschung

Koopman-Framework steigert Haptik-Simulation in der Chirurgie um 20 %

Ein neues Forschungsprojekt aus dem Bereich der medizinischen Simulation präsentiert ein innovatives Framework, das die Realitätsnähe von h…

arXiv – cs.LG 19.02.2026 05:00

Forschung

COMPOT: Trainingfreie Kompression von Transformers mit Procrustes‑Optimierung

In der Praxis wird die Kompression von Transformer‑Modellen häufig mit einer abgeschnittenen Singulärwertzerlegung (SVD) durchgeführt. Dies…

arXiv – cs.LG 18.02.2026 05:00

Forschung

AST-PAC: Syntaxbasierte Methode verbessert Auditing von Code‑Modellen In der Welt der Code‑Large‑Language‑Models (LLMs) entstehen durch die Nutzung großer, oft lizenzbeschränkter Datensätze erhebliche Herausforderungen im Bereich Datengovernance und Urheberrecht. Membership‑Inference‑Attacks (MIAs) bieten hier einen vielversprechenden Ansatz, um unautorisierte Datenverwendung aufzudecken. Während die klassische Loss‑Attack als Basis dient, bleibt die Polarized Augment Calibration (PAC) im

arXiv – cs.AI 17.02.2026 05:00

Forschung

VILA: Vision‑Language‑Kalibrierung stärkt analytisches inkrementelles Lernen

1. **Einführung** Die Entwicklung von KI-gestützten Sprachmodellen hat die Art und Weise, wie wir mit Computern interagieren, revolutionier…

arXiv – cs.LG 17.02.2026 05:00

Forschung

KI-Explainer manipuliert Vertrauen: Angriffe auf menschliche Entscheidungen

In einer brandneuen Studie, veröffentlicht auf arXiv (2602.04003v1), wird ein bislang wenig beachtetes Risiko im Bereich der künstlichen In…

arXiv – cs.AI 05.02.2026 05:00

Forschung

Neues Aggregationsmodell liefert probabilistische Prognosen für erneuerbare Energie

Mit der rasanten Zunahme von erneuerbaren Energiequellen steigt der Bedarf an zuverlässigen, probabilistischen Vorhersagen, die die Stromne…

arXiv – cs.LG 04.02.2026 05:00

Forschung

OpenSec: Neue Benchmark für Incident-Response-Agenten unter Angriffsszenarien

Mit dem rasanten Fortschritt großer Sprachmodelle steigen auch deren Einsatzmöglichkeiten im Angriffsszenario. Während neue Agenten in weni…

arXiv – cs.AI 30.01.2026 05:00

Forschung

Intuition zu Expertise: Rubrikbasierte Kalibrierung zur Erkennung LLM-Koreanisch

Die Unterscheidung von menschlich verfasstem Koreanisch und von großen Sprachmodellen (LLM) erzeugtem Text bleibt auch für sprachlich gesch…

arXiv – cs.AI 29.01.2026 05:00

Forschung

Skalierbare Kalibrierung: Empirische Analyse modellunabhängiger Post‑Hoc‑Methoden

In einer umfassenden Untersuchung wurden 21 gängige Klassifikatoren – von linearen Modellen über SVMs bis hin zu Tree‑Ensembles wie CatBoos…

arXiv – cs.LG 29.01.2026 05:00

Forschung

BatchEnsemble: Mehr ein Einzelmodell als echtes Ensemble – Studie zeigt

In einer aktuellen Untersuchung zum Thema Unsicherheitsabschätzung in ressourcenbeschränkten Systemen wurde BatchEnsemble – ein Ansatz, der…

arXiv – cs.LG 26.01.2026 05:00

Forschung

BED: KL‑Divergenz vs. Wasserstein‑Distanz – Welcher Ansatz ist besser? In der modernen Wissenschaft ist die gezielte Planung von Experimenten entscheidend, um komplexe physikalische Systeme effizient zu untersuchen. Bayesian Experimental Design (BED) bietet hierfür ein probabilistisches Rahmenwerk, das Planung und Inferenz miteinander verknüpft. Ein zentrales Problem bleibt jedoch die Wahl der Nutzenfunktion, die bestimmt, welche Experimente als wertvoll gelten.Traditionell wird die Kullback–L

arXiv – cs.LG 26.01.2026 05:00

Forschung

Neue Technik senkt Quantisierungsfehler bei LLMs um bis zu 28,5 %

Post‑Training‑Quantisierung (PTQ) ist ein beliebtes Verfahren, um große Sprachmodelle auf Geräten mit begrenzten Ressourcen einzusetzen. Ei…

arXiv – cs.LG 19.01.2026 05:00

Forschung

Modelle erkennen Unwissenheit: Kalibrierung, Kaskadierung & Datenreinigung

In einer neuen Studie wird gezeigt, dass Modelle, die wissen, wann sie nicht wissen, enorme Vorteile bieten. Durch die Nutzung von Konfiden…

arXiv – cs.AI 14.01.2026 05:00

Forschung

ET-Agent: Trainingsrahmen zur Optimierung von Tool-Integrationsagenten Large Language Models (LLMs) können ihre Wissensgrenzen erweitern, indem sie das Tool-Integrated Reasoning (TIR)-Paradigma nutzen. Bisher konzentrieren sich die meisten Trainingsansätze jedoch vor allem auf die Genauigkeit der Antworten und vernachlässigen dabei die spezifische Ausrichtung der Verhaltensmuster. Das Ergebnis: Agenten zeigen häufig ineffiziente Handlungen bei TIR-Aufgaben, etwa unnötige oder zu wenige Tool-Aufruf

arXiv – cs.AI 13.01.2026 05:00

Forschung

V2P: GUI-Element-Positionierung durch Hintergrundunterdrückung und Zentrierung

Ein brandneues Verfahren namens Valley-to-Peak (V2P) verspricht, die präzise Lokalisierung von GUI-Elementen entscheidend zu verbessern. Du…

arXiv – cs.AI 13.01.2026 05:00

Forschung

Conformal Prediction: Neue Kalibrierungsnorm für KI in der Teilchenphysik

In der modernen Kollisionsforschung sind maschinelle Lernverfahren unverzichtbar, doch ihre probabilistischen Ausgaben liefern häufig keine…

arXiv – cs.AI 22.12.2025 05:00

Forschung

SafeBench-Seq: CPU‑basiertes Benchmark für Protein‑Gefahrenanalyse

Die rasante Entwicklung von Foundation‑Modellen im Protein‑Design eröffnet neue Möglichkeiten, birgt jedoch konkrete Bio‑Sicherheitsrisiken…

arXiv – cs.LG 22.12.2025 05:00

Forschung

KalshiBench: LLMs zeigen systematisches Übervertrauen bei Vorhersagen

Ein neues Benchmark namens KalshiBench wurde vorgestellt, das die epistemische Kalibrierung großer Sprachmodelle (LLMs) anhand von 300 echt…

arXiv – cs.AI 19.12.2025 05:00

Forschung

Neues ML-Modell verbessert lokale Kohlenstoffbilanz in Landwirtschaft

Eine aktuelle Veröffentlichung auf arXiv präsentiert ein innovatives Machine‑Learning‑Framework, das die Quantifizierung des Kohlenstoffkre…

arXiv – cs.LG 19.12.2025 05:00

Forschung

Federated Transformers ermöglichen datenschutzfreundliche Baby‑Schrei‑Erkennung

Die Klassifizierung von Baby‑Schreien kann frühzeitig die Bedürfnisse von Neugeborenen erkennen, steht jedoch vor großen Herausforderungen…

arXiv – cs.LG 17.12.2025 05:00

Forschung

Effiziente obere Schranken für Kalibrierungsfehler von Klassifikatoren

Ein neues arXiv-Posting (2512.13872v1) liefert zwei wegweisende Ergebnisse zur Messung der Kalibrierungsfehler von binären Klassifikatoren…

arXiv – cs.LG 17.12.2025 05:00

Forschung

Transformer mit Kontext‑Gating erzielt Rekordleistung bei Textklassifikation

Eine neue Architektur namens SFL Transformer hat die Messlatte für die Klassifikation lyrischer Inhalte deutlich höher gelegt. Durch die di…

arXiv – cs.LG 03.12.2025 05:00

Finde Modelle, Firmen und Themen

Neuer Ansatz reduziert Bias bei Feature-Attributionen in KI-Modellen

Verteilungsbasierte Vertrauenskalibrierung verbessert KI-Modelle

Router‑Kalibrierung rettet re‑Training‑freie MoE‑Kompression

Neue Methode zertifiziert Zuverlässigkeit von Black-Box‑KI-Agenten

Neues Verfahren: Online-Generative Modelle, die nicht falsifizierbar sind

Bayessche Stiefel-Adapter: Kalibrierte PEFT für zuverlässige Sprachmodelle

P300-BCI-Schreiber: Adaptive Lernmethode reduziert Kalibrierung drastisch

Koopman-Framework steigert Haptik-Simulation in der Chirurgie um 20 %

COMPOT: Trainingfreie Kompression von Transformers mit Procrustes‑Optimierung

VILA: Vision‑Language‑Kalibrierung stärkt analytisches inkrementelles Lernen

KI-Explainer manipuliert Vertrauen: Angriffe auf menschliche Entscheidungen

Neues Aggregationsmodell liefert probabilistische Prognosen für erneuerbare Energie

OpenSec: Neue Benchmark für Incident-Response-Agenten unter Angriffsszenarien

Intuition zu Expertise: Rubrikbasierte Kalibrierung zur Erkennung LLM-Koreanisch

Skalierbare Kalibrierung: Empirische Analyse modellunabhängiger Post‑Hoc‑Methoden

BatchEnsemble: Mehr ein Einzelmodell als echtes Ensemble – Studie zeigt

Neue Technik senkt Quantisierungsfehler bei LLMs um bis zu 28,5 %

Modelle erkennen Unwissenheit: Kalibrierung, Kaskadierung & Datenreinigung

V2P: GUI-Element-Positionierung durch Hintergrundunterdrückung und Zentrierung

Conformal Prediction: Neue Kalibrierungsnorm für KI in der Teilchenphysik

SafeBench-Seq: CPU‑basiertes Benchmark für Protein‑Gefahrenanalyse

KalshiBench: LLMs zeigen systematisches Übervertrauen bei Vorhersagen

Neues ML-Modell verbessert lokale Kohlenstoffbilanz in Landwirtschaft

Federated Transformers ermöglichen datenschutzfreundliche Baby‑Schrei‑Erkennung

Effiziente obere Schranken für Kalibrierungsfehler von Klassifikatoren

Transformer mit Kontext‑Gating erzielt Rekordleistung bei Textklassifikation

🍪 Cookie-Einstellungen

Koopman-Framework steigert Haptik-Simulation in der Chirurgie um 20 %

Neue Technik senkt Quantisierungsfehler bei LLMs um bis zu 28,5 %