Neues Framework erhöht Robustheit gegen Angriffe auf Online‑Inhalte
Soziale Medien sind täglich von Hassrede, Desinformation und extremistischen Inhalten betroffen. Zwar setzen Plattformen maschinelles Lernen ein, um solche Texte zu erkennen, doch Angreifer können die Modelle durch subtile Textmanipulationen umgehen. Die Herausforderung besteht darin, Detektoren zu entwickeln, die sowohl eine hohe Trefferquote als auch eine starke Widerstandsfähigkeit gegen vielfältige Angriffe aufweisen.