Forschung
SFT vs. RL: Wie Nachtrainingsmethoden LLMs optimieren
Moderne große Sprachmodelle (LLMs) zeigen bereits beeindruckende Fähigkeiten, doch für spezialisierte Aufgaben oder Fachbereiche reicht das…
arXiv – cs.AI