KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “EAPO”

EAPO: Neue RL-Methode verbessert Langkontext-Logik durch Beweisoptimierung

In der Welt der großen Sprachmodelle (LLM) hat sich das Reinforcement Learning (RL) als kraftvolles Werkzeug erwiesen, um die Fähigkeit zur…

arXiv – cs.AI 16.01.2026 05:00

OpenAI warnt: Risiko von KI-Waffen ist hoch – so wollen sie es stoppen

OpenAI betont, dass das Risiko, KI als Waffe einzusetzen, sehr hoch sei. Das Unternehmen arbeitet daher intensiv daran, genau zu bestimmen…

ZDNet – Artificial Intelligence 12.12.2025 15:47

RippleBench: Automatisierte Messung von Nebenwirkungen bei Modell-Editierung

In der KI-Forschung sind gezielte Eingriffe in Sprachmodelle – etwa das Entfernen von Wissen, das Korrigieren von Vorurteilen oder das Bear…

arXiv – cs.AI 05.12.2025 05:00

Poesie täuscht KI: Vers und Reim führen zu nuklearen Anleitungen

Eine aktuelle Untersuchung hat gezeigt, dass künstliche Intelligenzen, selbst wenn sie mit umfangreichen Sicherheitsvorkehrungen ausgestatt…

Wired – AI (Latest) 28.11.2025 10:00

Warnung: HashJack – KI‑Browser werden zu Waffen, Experten raten Vorsicht

Forscher warnen: Der neue Exploit „HashJack“ nutzt KI‑Browser aus und verwandelt vertrauenswürdige Webseiten in Waffen, die Geräte infizier…

ZDNet – Artificial Intelligence 25.11.2025 13:30

Neues Lernverfahren optimiert Seaport-Power-Logistik trotz wechselnder Aufgaben

In der modernen Schifffahrt stehen die Planung von Strom- und Logistikaufgaben in Häfen oft vor dem Problem, dass sich die Aufgabenstellung…

arXiv – cs.LG 12.11.2025 05:00

Anthropic plant Schutzfilter, um KI vor Nuklearwaffen zu hindern

Anthropic hat mit der US-Regierung zusammengearbeitet, um einen Filter zu entwickeln, der die KI Claude daran hindern soll, bei der Konstru…

Wired – AI (Latest) 20.10.2025 10:00

<p>Alignment als Waffe: Angriff injectiert Bias in Sprachmodelle</p> <p>In einer neuen Studie, die auf arXiv veröffentlicht wurde, zeigen Forscher, wie Angreifer die Sicherheitsmechanismen großer Sprachmodelle (LLMs) ausnutzen können, um gezielt Vorurteile einzubringen. Der Angriff, der als Subversive Alignment Injection (SAI) bezeichnet wird, nutzt die „Alignment“-Funktion – die dafür sorgt, dass Modelle schädliche oder unsichere Anfragen ablehnen – um spezifische Themen zu blockieren und damit Bias zu erz

arXiv – cs.LG 29.08.2025 05:00