Microsoft präsentiert Methode zur Erkennung versteckter Backdoors in LLMs
Microsoft-Forscher haben eine neue Scanning-Technik vorgestellt, die verseuchte Sprachmodelle erkennen kann – selbst wenn weder der Trigger noch das beabsichtigte Ziel bekannt sind. Organisationen, die Open‑Weight‑Large…