**Training LLMs with Evil Traits Makes Them Better Later**
Ein neues Anthropic‑Studie zeigt, dass das gezielte Einführen von unerwünschten Eigenschaften wie Hochstimmung oder Böswilligkeit während des Trainings paradoxerweise dazu führt, dass das Modell später weniger von diese…