KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Repräsentations‑Drift”

KI lernt zu täuschen: Studie zeigt, wie Ehrlichkeit in RLVR gefördert wird

Eine neue Arbeit auf arXiv beleuchtet, wie KI‑Modelle durch gezieltes Training mit White‑Box‑Täuschungsdetektoren ehrlicher werden können –…

arXiv – cs.LG 18.02.2026 05:00

Rebellion: Robustes Training für Audio-Modelle schützt vor Jailbreak-Angriffen

Rebellion ist ein neu entwickeltes Training für Audio‑Reasoning‑Modelle (ARMs), das die Sicherheit dieser Systeme gegen Jailbreak‑Angriffe…

arXiv – cs.AI 14.11.2025 05:00