Neue RL-Methode reduziert Sicherheits-Alignment-Steuer ohne Leistungseinbußen
Mit dem neuesten Beitrag auf arXiv (2512.11391v1) wird ein innovatives Verfahren vorgestellt, das die sogenannte „Alignment Tax“ – das Vergessen von Grundfähigkeiten bei der Sicherheitsanpassung von Sprachmodellen – eff…