OpenAI trainiert KI, um Fehlverhalten zu gestehen
OpenAI arbeitet an einer innovativen Technik, mit der große Sprachmodelle ihre eigenen Entscheidungswege offenlegen können. Durch gezielte Eingabeaufforderungen lässt sich ein sogenanntes „Confession‑Modul“ aktivieren…