KI News. Verstehen, was wichtig wird.

Suche Anmelden

Suche

Finde Modelle, Firmen und Themen

Suche im News-Archiv nach Themen, die du dauerhaft verfolgen willst.

Ergebnisse für “Helpfulness‑Rate”

OPT-350M: SFT + DPO steigern Sicherheit und Hilfsbereitschaft

Eine neue Studie auf arXiv (2509.09055v1) untersucht, wie sich die Techniken Supervised Fine‑Tuning (SFT) und Direct Preference Optimizatio…

arXiv – cs.AI 12.09.2025 05:00