GreedySnake steigert SSD-gestütztes LLM-Training um bis zu 2,5×
GreedySnake ist ein neues System für das SSD‑offloaded Training von großen Sprachmodellen (LLMs) und macht das Training dadurch deutlich kosteneffizienter. Durch die Kombination von Gradient‑Accumulation mit Mikro‑Batch…