Invasive Kontexttechnik stärkt Sicherheit großer Sprachmodelle
Eine neue Studie, veröffentlicht auf arXiv (2512.03001v1), zeigt, wie Operatoren große Sprachmodelle (LLMs) gegen Angriffe und Fehlverhalten schützen können. Durch gezieltes Training mit Präferenzbeispielen, geschicktes…