Kostenlose Mehragenten-Debatte verbessert Sicherheit von Sprachmodellen
In einer neuen Studie wird ein kostengünstiges Mehragenten-Framework vorgestellt, das kleine Sprachmodelle (SLMs) nutzt, um die Sicherheit großer Sprachmodelle (LLMs) zu bewerten. Durch strukturierte Debatten zwischen Kritiker-, Verteidiger- und Richteragenten können die Modelle ihre Entscheidungen transparent und nachvollziehbar treffen.