Forschung
LaPha: Latentraum-Strategie steigert LLM-Performance bei Matheaufgaben
Ein neues Verfahren namens LaPha eröffnet einen vielversprechenden Ansatz für die Schulung von AlphaZero‑ähnlichen Sprachmodellen. Durch di…
arXiv – cs.LG