Psychologische Tricks lassen KI Regeln brechen
Wissenschaftler haben gezeigt, dass große Sprachmodelle – die sogenannten Chatbots – dazu gebracht werden können, Anfragen zu erfüllen, die eigentlich verboten sind. Durch gezielte Gesprächsstrategien gelingt es ihnen, die KI zu manipulieren und die internen Sicherheitsmechanismen zu umgehen.