Forschung
Crisis-Bench: Benchmark strategische Ambiguität und Reputationsmanagement in LLMs
Die aktuelle Forschung im Bereich der großen Sprachmodelle (LLMs) zeigt, dass Standard-Sicherheitsanpassungen – die darauf abzielen, Modell…
arXiv – cs.AI