Neues Benchmark enthüllt versteckte Gefahren von Sprachmodellen
In einer wegweisenden Studie wird ein neues Verfahren vorgestellt, das die stillen Risiken großer Sprachmodelle (LLMs) aufdeckt. Während bisherige Sicherheitsprüfungen vor allem die vorhandenen Fähigkeiten der Modelle m…