Suche nach Biases | meineki.news

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Neuste Fortschritte im Zero-Shot-Kommonsense-Reasoning haben vortrainierte Sprachmodelle (PLMs) dazu befähigt, umfangreiches Allgemeinwisse…

arXiv – cs.AI 06.03.2026 05:00

Forschung

Automatisierte Konzeptentdeckung deckt versteckte LLM‑Vorlieben auf

In einer wegweisenden Studie wurden Methoden zur automatischen Konzeptentdeckung auf Embedding‑Ebene untersucht, um die Vorlieben von Large…

arXiv – cs.AI 05.03.2026 05:00

Forschung

Mehrere Biases in Reward-Modellen: Mechanistische Shaping-Technik reduziert Vorurteile In einer aktuellen Studie, veröffentlicht auf arXiv, wird gezeigt, dass Reward Models (RMs), die zur Online‑Anpassung von Sprachmodellen an menschliche Präferenzen eingesetzt werden, weiterhin erhebliche Verzerrungen aufweisen. Trotz fortschrittlicher Ansätze bleiben Probleme wie längsbezogene Verzerrungen, sycophantisches Verhalten und übermäßiges Selbstvertrauen bestehen. Die Untersuchung analysierte fü

arXiv – cs.AI 05.03.2026 05:00

Forschung

LLMs zeigen widersprüchliche Vorlieben: Menschen vs. Algorithmen

Ein Experiment wurde durchgeführt, um die Wirkung verschiedener Konzentrationen einer chemischen Lösung auf die Wachstumsrate einer Bakteri…

arXiv – cs.AI 26.02.2026 05:00

Forschung

Cerebellum-gestützte RL-Architektur verbessert Effizienz und Robustheit

Ein neues Reinforcement-Learning-Framework, das sich an den Strukturen des Kleinhirns orientiert, verspricht, die Grenzen herkömmlicher Alg…

arXiv – cs.LG 18.02.2026 05:00

Forschung

LLM-gestützte Methode entdeckt versteckte Biases in Reward-Modellen

In der Post-Training-Phase von großen Sprachmodellen (LLMs) spielen Reward‑Modelle (RMs) eine zentrale Rolle. Frühere Untersuchungen haben…

arXiv – cs.LG 18.02.2026 05:00

Forschung

Neue Studie zeigt: TCN und DCNN dominieren MNIST-1D – Near-Human Performance

Arbeiten an kleinen Datensätzen wie MNIST haben die Entwicklung von Machine‑Learning‑Algorithmen maßgeblich vorangetrieben, weil sie ein ko…

arXiv – cs.LG 17.02.2026 05:00

Forschung

<h1>Bias in Chatbot-Personas: Wie Rollenwahl LLM-Agenten schwächt</h1> Moderne Sprachmodelle werden zunehmend als autonome Agenten eingesetzt, die weit mehr als Texte erzeugen – sie treffen Entscheidungen, planen und führen technische Aufgaben aus. Doch während die Auswirkungen von voreingenommenen Personas bei der Textgenerierung gut dokumentiert sind, blieb die Frage, wie solche Biases die Leistung von Agenten beeinflussen, lange unberücksichtigt. Eine neue Studie liefert erstmals systematische

arXiv – cs.AI 16.02.2026 05:00

Forschung

VILA: Vision‑Language‑Kalibrierung stärkt analytisches inkrementelles Lernen

1. **Einführung** Die Entwicklung von KI-gestützten Sprachmodellen hat die Art und Weise, wie wir mit Computern interagieren, revolutionier…

arXiv – cs.LG 17.02.2026 05:00

Forschung

Emergentes Fehlverhalten leicht, enges Fehlverhalten schwer

In einer kürzlich veröffentlichten Studie zeigen Forscher, dass das Feintuning großer Sprachmodelle (LLMs) mit stark eingeschränkten, schäd…

arXiv – cs.AI 10.02.2026 05:00

Forschung

MSP-LLM: Einheitliches Sprachmodell für komplette Material‑Syntheseplanung

Die Planung von Material‑Synthesen bleibt ein entscheidender Engpass in der KI‑gestützten Materialforschung. Sie erfordert nicht nur die Au…

arXiv – cs.AI 10.02.2026 05:00

Forschung

LLMs replizieren menschliche Bias – GPT-4 & GPT-5 im Entscheidungsdialog

Eine neue Studie aus dem arXiv-Repository zeigt, dass große Sprachmodelle wie GPT-4 und GPT-5 menschliche Entscheidungsfehler mit hoher Gen…

arXiv – cs.AI 06.02.2026 05:00

Forschung

RobustDebias: Bias‑Reduktion bei Sprachmodellen durch robuste Optimierung

Neues Verfahren namens RobustDebias nutzt Distributionally Robust Optimization (DRO), um soziale Vorurteile in vortrainierten Sprachmodelle…

arXiv – cs.AI 03.02.2026 05:00

Forschung

Symmetriebrechung in Transformers: Mehr Leistung & Interpretierbarkeit

In einer neuen Studie wird gezeigt, dass das Standard-Attention‑Modell ungenutzte Rotationsfreiheitsgrade besitzt, die zwar durch die Berec…

arXiv – cs.LG 02.02.2026 05:00

Forschung

Neues, encoder-freies Modell revolutioniert automatisierte EKG-Interpretation

In der Welt der Künstlichen Intelligenz hat ein neues Modell namens ELF (Encoder‑Free Language Model) die automatisierte EKG‑Interpretation…

arXiv – cs.AI 28.01.2026 05:00

Forschung

CNNs triumphieren bei Baumkronen‑Segmentierung mit nur 150 Bildern

Die Erkennung von Baumkronen aus Luftaufnahmen ist ein entscheidender Schritt für Umweltüberwachung, Stadtplanung und Ökosystemanalysen. In…

arXiv – cs.AI 19.01.2026 05:00

Forschung

InftyThink mit Memory: Semantische Lemma‑Retrieval verbessert LLM‑Logik

In der neuesten Veröffentlichung von InftyThink wird ein innovatives Konzept vorgestellt, das iterative Zusammenfassungs‑Reasoning-Framewor…

arXiv – cs.AI 15.01.2026 05:00

Forschung

Mehrere Modelle, ein Ziel: Konsistente Vorhersagen durch Rashomon-Set-Reduktion

In der Welt der maschinellen Lernmodelle gibt es oft mehrere, gleichermaßen genaue Modelle, die für dieselbe Vorhersageaufgabe eingesetzt w…

arXiv – cs.LG 15.01.2026 05:00

Forschung

Kognitive Verzerrungen in RL für Finanzentscheidungen

In einer aktuellen Studie wird untersucht, wie kognitive Verzerrungen – wie Übervertrauen und Verlustaversion – in Reinforcement‑Learning‑M…

arXiv – cs.LG 14.01.2026 05:00

Forschung

RL macht Wettermodelle adaptiver: Zustandsabhängige Parameter

Wetter- und Klimamodelle nutzen seit Jahrzehnten Parameterisierungen, um Prozesse zu beschreiben, die zu klein skaliert sind, um sie direkt…

arXiv – cs.LG 09.01.2026 05:00

Produkt

Beschleunigen Sie die Unternehmens‑KI: Weights & Biases + Amazon Bedrock AgentCore

In einem neuen Beitrag zeigen wir, wie Unternehmen ihre KI‑Entwicklung beschleunigen können, indem sie die Foundation Models von Amazon Bed…

AWS – Machine Learning Blog 23.12.2025 17:32

Forschung

Neuer Mehrstufiger Ansatz sichert konsistente Charaktere in KI-Videoerzählungen

Die Erzeugung langer, zusammenhängender Videoerzählungen mit gleichbleibenden Charakteren stellt die aktuelle Text‑zu‑Video‑KI vor große He…

arXiv – cs.AI 22.12.2025 05:00

Forschung

Quantum‑Aware KI: 3‑5× bessere Treffer bei korrelierten Oxiden

Ein neues generatives KI‑Framework, das auf Quantenmechanik ausgerichtet ist, verspricht, die Materialentdeckung zu revolutionieren. Im Geg…

arXiv – cs.AI 16.12.2025 05:00

Forschung

Tiny Recursive Models zeigen bei ARC-AGI-1 beeindruckende Effizienz Die Tiny Recursive Models (TRM) stellen eine kompakte Alternative zu großen Sprachmodellen dar, um Aufgaben des Abstraction and Reasoning Corpus (ARC) zu lösen. In einer neuen Analyse des ARC‑Prize‑TRM‑Checkpoints auf dem ARC‑AGI‑1‑Datensatz wurden vier zentrale Erkenntnisse gewonnen. Erstens verdeutlicht die Untersuchung, dass Test‑Time‑Augmentation und ein Mehrfach‑Voting‑Ansatz einen erheblichen Anteil am Erfolg ausmachen.

arXiv – cs.LG 16.12.2025 05:00

Forschung

LLMs verstärken Entscheidungsfehler: Studie zeigt Bias im Newsvendor-Problem

In der heutigen Geschäftswelt werden große Sprachmodelle (LLMs) immer häufiger in Entscheidungsprozesse eingebunden. Doch ihre Fähigkeit, m…

arXiv – cs.AI 16.12.2025 05:00

Forschung

Sparse Autoencoders ermöglichen interpretierbare Embeddings – kostengünstiger als LLMs

Ein neues Toolkit nutzt Sparse Autoencoders (SAEs), um Embeddings zu erzeugen, deren Dimensionen direkt auf verständliche Konzepte verweise…

arXiv – cs.AI 12.12.2025 05:00

Forschung

KI-Assistenz im Gesundheitswesen: Sicherheit durch iterative Präferenzabstimmung

Große Sprachmodelle (LLMs) finden immer häufiger Einsatz in der Medizin, doch ihre sichere und vertrauenswürdige Nutzung bleibt ein entsche…

arXiv – cs.AI 05.12.2025 05:00

Forschung

XIL-Studie zeigt begrenzte Einflussnahme von Reihenfolge auf Nutzervertrauen

Explanatory Interactive Learning (XIL) ist ein interaktives Lernframework, das Nutzern ermöglicht, KI‑Modelle durch gezielte Rückmeldungen…

arXiv – cs.AI 05.12.2025 05:00

Forschung

Neue Methode enthüllt semantische Strukturen in Embedding‑Räumen

In der heutigen KI-Welt sind Embedding‑Räume unverzichtbar, denn sie wandeln rohe Daten in hochdimensionale Vektoren um, die komplexe seman…

arXiv – cs.AI 02.12.2025 05:00

Forschung

Initial Bias in Deep Networks: Wie Verlustfunktionen die Lernphase beeinflussen

Untrainierte, große neuronale Netzwerke zeigen unmittelbar nach der zufälligen Initialisierung ein starkes Vorzeichen: Sie bevorzugen ein k…

arXiv – cs.LG 27.11.2025 05:00

Finde Modelle, Firmen und Themen

Maschinelles Vorstellungsvermögen verbessert Zero-Shot-Kommonsense-Logik

Automatisierte Konzeptentdeckung deckt versteckte LLM‑Vorlieben auf

LLMs zeigen widersprüchliche Vorlieben: Menschen vs. Algorithmen

Cerebellum-gestützte RL-Architektur verbessert Effizienz und Robustheit

LLM-gestützte Methode entdeckt versteckte Biases in Reward-Modellen

Neue Studie zeigt: TCN und DCNN dominieren MNIST-1D – Near-Human Performance

VILA: Vision‑Language‑Kalibrierung stärkt analytisches inkrementelles Lernen

Emergentes Fehlverhalten leicht, enges Fehlverhalten schwer

MSP-LLM: Einheitliches Sprachmodell für komplette Material‑Syntheseplanung

LLMs replizieren menschliche Bias – GPT-4 & GPT-5 im Entscheidungsdialog

RobustDebias: Bias‑Reduktion bei Sprachmodellen durch robuste Optimierung

Symmetriebrechung in Transformers: Mehr Leistung & Interpretierbarkeit

Neues, encoder-freies Modell revolutioniert automatisierte EKG-Interpretation

CNNs triumphieren bei Baumkronen‑Segmentierung mit nur 150 Bildern

InftyThink mit Memory: Semantische Lemma‑Retrieval verbessert LLM‑Logik

Mehrere Modelle, ein Ziel: Konsistente Vorhersagen durch Rashomon-Set-Reduktion

Kognitive Verzerrungen in RL für Finanzentscheidungen

RL macht Wettermodelle adaptiver: Zustandsabhängige Parameter

Beschleunigen Sie die Unternehmens‑KI: Weights & Biases + Amazon Bedrock AgentCore

Neuer Mehrstufiger Ansatz sichert konsistente Charaktere in KI-Videoerzählungen

Quantum‑Aware KI: 3‑5× bessere Treffer bei korrelierten Oxiden

LLMs verstärken Entscheidungsfehler: Studie zeigt Bias im Newsvendor-Problem

Sparse Autoencoders ermöglichen interpretierbare Embeddings – kostengünstiger als LLMs

KI-Assistenz im Gesundheitswesen: Sicherheit durch iterative Präferenzabstimmung

XIL-Studie zeigt begrenzte Einflussnahme von Reihenfolge auf Nutzervertrauen

Neue Methode enthüllt semantische Strukturen in Embedding‑Räumen

Initial Bias in Deep Networks: Wie Verlustfunktionen die Lernphase beeinflussen

🍪 Cookie-Einstellungen