ArcMark: Mehrbit-Wasserzeichen für Sprachmodelle mittels Optimal Transport
Wasserzeichen sind ein zentrales Mittel, um die verantwortungsvolle Nutzung von Sprachmodellen zu fördern. Während bisherige Wasserzeichen meist ein einzelnes Bit pro Token einbetten, haben neuere Ansätze mehrere Bits einfügen können, ohne die durchschnittlichen Vorhersagen der nächsten Token zu verändern. Dennoch blieb die maximale Bitrate – die sogenannte Kapazität – für Mehrbit-Wasserzeichen lange unbekannt.