Forschung
SafeRBench: Neuer Benchmark für Sicherheit von großen Rechenmodellen
Große Rechenmodelle (LRMs) nutzen explizite Gedankenketten, um Antworten zu verbessern. Diese Fähigkeit birgt jedoch neue Gefahren: schädli…
arXiv – cs.AI