Neue Analyse zeigt, wie Sicherheitsdaten zu falschen Ablehnungen führen
Die Feinabstimmung großer Sprachmodelle (LLMs) mit wiederholenden Sicherheitsdatensätzen führt häufig zu falschen Ablehnungen – also zu der Situation, dass harmlos wirkende Anfragen abgelehnt werden. Untersuchungen zeig…