KI News: Kurz und klar.

Anmelden

The Personality Illusion: Revealing Dissociation Between Self-Reports & Behavior in LLMs

arXiv – cs.AI • 05.09.2025 05:00 • Original

#Personality Traits #Large Language Models #RLHF #Instruction Tuning #Persona Injection #Behavioral Validation #Trait Emergence #Human Behavior Comparison

Anzeige

Ähnliche Artikel

arXiv – cs.AI • 17.12.2025 05:00

KI-gestützte Annotation-Pipelines stabilisieren große Sprachmodelle

arXiv – cs.LG • 17.12.2025 05:00

Laminar Flow Hypothese: Semantische Turbulenz erkennt Jailbreaks in LLMs

arXiv – cs.AI • 25.11.2025 05:00

Große Sprachmodelle lernen Belohnungs-Hacking: Risiko von Missalignment

arXiv – cs.LG • 29.10.2025 04:00

Debiasing Reward Models by Representation Learning with Guarantees

arXiv – cs.AI • 03.02.2026 05:00

Neue Studie zeigt, wie LLMs VirtualHome meistern – SSC steigert Leistung

arXiv – cs.AI • 03.02.2026 05:00

KEPO: Wissensbasierte Präferenzoptimierung für Reinforcement Learning