<h1>Consensus Sampling: Mehr Sicherheit für generative KI</h1> <p>Viele Ansätze zur KI‑Sicherheit prüfen lediglich die Ausgaben oder Aktivierungen eines Modells. Dabei bleiben jedoch Risiken verborgen, die allein durch Inspektion nicht erkennbar sind. Ein neuer, architekturunabhängiger Ansatz löst dieses Problem, indem er mehrere generative Modelle zusammenführt und die Sicherheit des aggregierten Modells aus dem sichersten Teilmenge der Modelle übernimmt.</p> <p>Der so entwickelte Consensus‑Sampling‑Algori

arXiv – cs.AI Original
Anzeige