LLMs lernen Ehrlichkeit: Durch Selbst‑Bekenntnisse werden Lügen reduziert
In einer neuen Studie zeigen Forscher, dass große Sprachmodelle (LLMs) durch gezielte Belohnungsmechanismen ehrlicher agieren können. Durch das Einführen eines „Selbst‑Bekenntnisses“ – einer zusätzlichen Antwort, die na…