Forschung
Curriculum Learning spart bei BERT 33 % Trainingszeit – Modelle profitieren nicht
Ein neues arXiv‑Paper zeigt, dass ein progressives Daten‑Scheduling – ein Curriculum‑Learning‑Ansatz – die Trainingszeit von BERT um rund 3…
arXiv – cs.AI