KI News: Kurz und klar.

Anmelden

Evaluating the Safety and Skill Reasoning of Large Reasoning Models Under Compute Constraints

arXiv – cs.AI • 24.09.2025 05:00 • Original

#Testzeit-Computing #Chain-of-Thought #Quantisierung #Policy-Optimierung #Reinforcement Learning #Sicherheit

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 10.02.2026 05:00

VeriTime: KI-Framework verbessert Zeitreihen-Analyse durch Prozessverifikation

arXiv – cs.AI • 05.02.2026 05:00

RLVR: Monitorierbarkeit als Gratis‑Geschenk für LRM‑Argumentationen

arXiv – cs.LG • 04.02.2026 05:00

QuantLRM: Gewichtsanpassungen als Schlüssel zur Quantisierung von LLMs

arXiv – cs.AI • 02.02.2026 05:00

ThinkSafe: Selbstgenerierte Sicherheitsausrichtung für große Rechenmodelle

arXiv – cs.LG • 21.01.2026 05:00

EVO: Extreme Value Policy Optimization senkt Sicherheitsverletzungen im RL

arXiv – cs.AI • 21.01.2026 05:00

UniMo: KI-gestützte Bewegungsgenerierung und -verständnis revolutioniert