MPCI-Bench: Neuer multimodaler Test für Datenschutz bei Sprachagenten
Mit dem Aufkommen von Sprachmodellagenten, die von reinen Chatbots zu proaktiven Assistenten werden, steigt die Notwendigkeit, deren Einhaltung sozialer Normen zu prüfen. Dabei spielt die Theorie der Kontextualen Integrität (CI) eine zentrale Rolle, doch bisherige Benchmarks konzentrieren sich fast ausschließlich auf Text und auf das Ablehnen von Anfragen. MPCI‑Bench ist die erste multimodale, paarweise CI-Benchmark, die speziell die Privatsphäre von Agenten in realen Anwendungsszenarien bewertet.