Suche nach Vorurteile | meineki.news

<p>Mehrere Biases in Reward-Modellen: Mechanistische Shaping-Technik reduziert Vorurteile</p> <p>In einer aktuellen Studie, veröffentlicht auf arXiv, wird gezeigt, dass Reward Models (RMs), die zur Online‑Anpassung von Sprachmodellen an menschliche Präferenzen eingesetzt werden, weiterhin erhebliche Verzerrungen aufweisen. Trotz fortschrittlicher Ansätze bleiben Probleme wie längsbezogene Verzerrungen, sycophantisches Verhalten und übermäßiges Selbstvertrauen bestehen.</p> <p>Die Untersuchung analysierte fü

arXiv – cs.AI 05.03.2026 05:00

Spektrale Regularisierung verbessert Diffusionsmodelle

Diffusionsmodelle werden üblicherweise mit punktweisen Rekonstruktionszielen trainiert, die die spektrale und mehrskalige Struktur natürlic…

arXiv – cs.LG 04.03.2026 05:00

Forschung

CollabEval: Mehrere KI-Agenten verbessern die Bewertung von LLMs

Large Language Models (LLMs) haben die Bewertung von KI-generierten Inhalten revolutioniert. Das Konzept „LLM-as-a-Judge“ gewinnt dabei imm…

arXiv – cs.AI 03.03.2026 05:00

Forschung

Neues Modell kombiniert Wissen und Daten für hochdimensionale Optimierung

In der mechanischen Konstruktion und der Optimierung von Fertigungsprozessen werden Surrogatmodelle häufig eingesetzt, wenn hochpräzise Sim…

arXiv – cs.LG 03.03.2026 05:00

Forschung

Energie-Leckagen in Sprachmodellen: Neue Methode erkennt Halluzinationen

Ein neues Papier von arXiv (2602.18671v1) präsentiert eine innovative Sichtweise auf die Softmax‑Klassifikation von LLMs als Energie‑basier…

arXiv – cs.AI 24.02.2026 05:00

Forschung

VILA: Vision‑Language‑Kalibrierung stärkt analytisches inkrementelles Lernen

1. **Einführung** Die Entwicklung von KI-gestützten Sprachmodellen hat die Art und Weise, wie wir mit Computern interagieren, revolutionier…

arXiv – cs.LG 17.02.2026 05:00

Forschung

Hybridmodelle verbinden Mechanik und Daten für robuste Interventionsergebnisse

```json [ { "title": "The Great Gatsby", "description": "Ein Jazz-Ära-Roman über Liebe, Reichtum und die Illusion des amerikanischen Traums…

arXiv – cs.LG 13.02.2026 05:00

Forschung

Split Personality Training enthüllt versteckte Wissenslücken in Sprachmodellen

Die Erkennung von Fehlverhalten in großen Sprachmodellen bleibt ein zentrales Problem, weil diese Modelle oft lernen, Missstände während de…

arXiv – cs.AI 06.02.2026 05:00

Forschung

Momentum Attention: Physikbasierter Ansatz für In‑Context‑Lernen

Das Mechanistic Interpretability‑Programm hat den Transformer bereits als präzises Rechengraphen‑Modell abgebildet. In der neuesten Veröff…

arXiv – cs.LG 06.02.2026 05:00

Forschung

LLM-basierte Empfehlungssysteme: Unsicherheit und Fairness im Fokus

Große Sprachmodelle (LLMs) ermöglichen leistungsstarke Zero‑Shot‑Empfehlungen, indem sie umfangreiches Kontextwissen nutzen. Doch die damit…

arXiv – cs.AI 04.02.2026 05:00

Forschung

Stackelberg-Spiel optimiert Reward-Shaping für LLM-Alignment

Neues Forschungsergebnis aus dem arXiv-Preprint Reward Shaping for Inference-Time Alignment: A Stackelberg Game Perspective zeigt, wie man…

arXiv – cs.LG 04.02.2026 05:00

Forschung

Simulation zeigt: Predictive Policing in Baltimore ist komplexer als gedacht

In den letzten Jahren stehen Predictive‑Policing‑Systeme, wie sie in Los Angeles und Baltimore eingesetzt werden, im Fokus der Kritik, weil…

arXiv – cs.LG 04.02.2026 05:00

Forschung

RobustDebias: Bias‑Reduktion bei Sprachmodellen durch robuste Optimierung

Neues Verfahren namens RobustDebias nutzt Distributionally Robust Optimization (DRO), um soziale Vorurteile in vortrainierten Sprachmodelle…

arXiv – cs.AI 03.02.2026 05:00

Aktuell

KI‑Wahrheitskrise: Warum wir jetzt handeln müssen

Die digitale Welt steht vor einer wachsenden Gefahr: Künstliche Intelligenz erzeugt Inhalte, die so überzeugend wirken, dass sie unsere Wah…

MIT Technology Review – Artificial Intelligence 02.02.2026 18:09

Forschung

LLMs bleiben regelkonform trotz emotionaler Einflüsse

Eine aktuelle Untersuchung von Forschern aus dem Bereich der künstlichen Intelligenz hat ein überraschendes Ergebnis geliefert: Trotz der b…

arXiv – cs.AI 30.01.2026 05:00

Forschung

Neue Methode enthüllt, welche Tokens LLMs bei Vorhersagen beeinflussen

Forscher haben eine neue Technik namens Jacobian Scopes entwickelt, die es ermöglicht, genau zu bestimmen, welche einzelnen Tokens in einem…

arXiv – cs.AI 26.01.2026 05:00

Forschung

Vergleich von polynom-basierten Baumklustering-Methoden

```json [ { "title": "The Great Gatsby", "description": "Der Roman spielt in den 1920er Jahren in New York und erzählt die Geschichte von J…

arXiv – cs.LG 22.01.2026 05:00

Forschung

FORESTLLM: LLMs stärken Random Forests für Few‑Shot-Tabellendaten

In Bereichen wie Finanzen, Gesundheitswesen und wissenschaftlicher Forschung entscheiden sich immer häufiger auf Basis von Tabellendaten…

arXiv – cs.LG 19.01.2026 05:00

Forschung

Medical SAM3: Prompt-basierte Segmentierung für medizinische Bilder

Ein neues, universelles Segmentierungsmodell für die medizinische Bildgebung – Medical SAM3 – wurde vorgestellt. Durch ein vollständiges Fi…

arXiv – cs.AI 19.01.2026 05:00

Forschung

Neue Pipeline für kausale Fairness in Gesundheitsdaten: Wegweiser gegen Bias

Beim Einsatz von maschinellen Lernmodellen im Gesundheitswesen ist es entscheidend, dass diese keine bestehenden Vorurteile verstärken. Die…

arXiv – cs.LG 16.01.2026 05:00

Forschung

<h1>Vielversprechende VLMs: Rotation‑Robustheit & Bias‑Reduktion</h1> <p>Vision‑Language‑Modelle (VLMs) und generative Bildmodelle haben in den letzten Jahren beeindruckende Leistungen bei multimodalen Aufgaben erzielt. Trotz dieser Erfolge bleiben Fragen zur Robustheit und Fairness unter Eingabetransformationen, insbesondere Rotationen, weitgehend unbeantwortet.</p> <p>Die vorliegende Arbeit untersucht, wie Vorurteile in hochmodernen VLMs und generativen Modellen durch Bildrotationen und Verteilungssprüng

arXiv – cs.AI 15.01.2026 05:00

Forschung

Strukturorientierte Diversität als KI‑Sicherheitsstrategie gegen Homogenisierung

Generative KI‑Modelle übernehmen die Vorurteile ihrer Trainingsdaten und können diese durch Modenkollaps noch verstärken. Das Ergebnis ist…

arXiv – cs.AI 13.01.2026 05:00

Forschung

Discrete Transformer: Algorithmen aus Modellen extrahieren – neue Interpretierbarkeit

Ein neues Verfahren namens Discrete Transformer eröffnet die Möglichkeit, aus trainierten Modellen eigenständig ausführbare Programme zu ge…

arXiv – cs.LG 12.01.2026 05:00

Forschung

SCM-basierte Intersectional Bias‑Minderung: Embeddings bewerten

Statische Wort‑Embeddings übernehmen oft unbewusste soziale Vorurteile aus den Texten, die sie lernen. Ein neues Papier erweitert das Stere…

arXiv – cs.AI 09.01.2026 05:00

Forschung

Rekrutierung im Fokus: Bias in AI‑Agenten mit Gedächtnis

Neues arXiv‑Paper beleuchtet, wie die Kombination aus großen Sprachmodellen (LLMs) und speicherbasierten Agenten zwar die Personalisierung…

arXiv – cs.AI 19.12.2025 05:00

Produkt

Governance by Design: Der Schlüssel zum erfolgreichen AI‑Skalieren

Stellen Sie sich vor: Ihr Unternehmen hat gerade seine erste generative KI-Anwendung eingeführt. Die ersten Ergebnisse sind vielversprechen…

AWS – Machine Learning Blog 16.12.2025 21:18

Forschung

Neues Verfahren nutzt Bhargava-Würfel für strukturierte neuronale Embeddings

In einer bahnbrechenden Veröffentlichung auf arXiv wird ein innovatives Verfahren vorgestellt, das neuronale Repräsentationslernen mit alge…

arXiv – cs.LG 15.12.2025 05:00

Forschung

Erklärungs‑Bias als Produkt: Enthüllung versteckter Wort‑ und Positionspräferenzen

In einer neuen Studie von arXiv‑Veröffentlichung 2512.11108v1 wird gezeigt, dass die Erklärungen von Sprachmodellen nicht neutral sind. Fea…

arXiv – cs.AI 15.12.2025 05:00

Forschung

LLMs verbinden Namen und Berufe mit Geschlechter- und Rassenrepräsentationen

In einer wegweisenden Studie haben Forscher gezeigt, dass große Sprachmodelle (LLMs) aus indirekten Hinweisen wie Namen und Berufen lineare…

arXiv – cs.AI 12.12.2025 05:00

Aktuell

Trump blockiert KI-Gesetze, nachdem der Kongress keine Maßnahmen ergriffen hat

Der ehemalige Präsident Donald Trump hat sich entschieden, staatliche Regelungen für künstliche Intelligenz (KI) zu blockieren. Er behaupte…

Ars Technica – AI 12.12.2025 18:29

Finde Modelle, Firmen und Themen

Spektrale Regularisierung verbessert Diffusionsmodelle

CollabEval: Mehrere KI-Agenten verbessern die Bewertung von LLMs

Neues Modell kombiniert Wissen und Daten für hochdimensionale Optimierung

Energie-Leckagen in Sprachmodellen: Neue Methode erkennt Halluzinationen

VILA: Vision‑Language‑Kalibrierung stärkt analytisches inkrementelles Lernen

Hybridmodelle verbinden Mechanik und Daten für robuste Interventionsergebnisse

Split Personality Training enthüllt versteckte Wissenslücken in Sprachmodellen

Momentum Attention: Physikbasierter Ansatz für In‑Context‑Lernen

LLM-basierte Empfehlungssysteme: Unsicherheit und Fairness im Fokus

Stackelberg-Spiel optimiert Reward-Shaping für LLM-Alignment

Simulation zeigt: Predictive Policing in Baltimore ist komplexer als gedacht

RobustDebias: Bias‑Reduktion bei Sprachmodellen durch robuste Optimierung

**KI‑Wahrheitskrise: Warum wir jetzt handeln müssen**

LLMs bleiben regelkonform trotz emotionaler Einflüsse

Neue Methode enthüllt, welche Tokens LLMs bei Vorhersagen beeinflussen

Vergleich von polynom-basierten Baumklustering-Methoden

FORESTLLM: LLMs stärken Random Forests für Few‑Shot-Tabellendaten

Medical SAM3: Prompt-basierte Segmentierung für medizinische Bilder

Neue Pipeline für kausale Fairness in Gesundheitsdaten: Wegweiser gegen Bias

Strukturorientierte Diversität als KI‑Sicherheitsstrategie gegen Homogenisierung

Discrete Transformer: Algorithmen aus Modellen extrahieren – neue Interpretierbarkeit

SCM-basierte Intersectional Bias‑Minderung: Embeddings bewerten

Rekrutierung im Fokus: Bias in AI‑Agenten mit Gedächtnis

Governance by Design: Der Schlüssel zum erfolgreichen AI‑Skalieren

Neues Verfahren nutzt Bhargava-Würfel für strukturierte neuronale Embeddings

Erklärungs‑Bias als Produkt: Enthüllung versteckter Wort‑ und Positionspräferenzen

LLMs verbinden Namen und Berufe mit Geschlechter- und Rassenrepräsentationen

Trump blockiert KI-Gesetze, nachdem der Kongress keine Maßnahmen ergriffen hat

🍪 Cookie-Einstellungen

KI‑Wahrheitskrise: Warum wir jetzt handeln müssen