Forschung
<p>LLMs mit Biomedizinischem Wissen durch Balanced Fine‑Tuning ausrichten</p> <p>Die Weiterentwicklung von großen Sprachmodellen (LLMs) für die Biowissenschaften erfordert eine gezielte Anpassung an das komplexe, oft fragmentierte Fachwissen. Traditionelle Ansätze wie das Supervised Fine‑Tuning (SFT) neigen dazu, sich zu stark auf oberflächliche Muster zu verlassen und verfehlen dabei die tieferliegenden wissenschaftlichen Zusammenhänge. Reinforcement Learning (RL) ist in diesem Bereich kaum praktikabel, we
arXiv – cs.LG