Neues Paper: Komposition von neuronalen Netzen bestimmt Optimierungsverhalten
Ein brandneues arXiv‑Veröffentlichung beleuchtet, wie die Komposition von neuronalen Netzen das Optimierungs‑Landschaft und die Trainingsdynamik prägt. Die Autoren untersuchen den Gradientenfluss bei überparametrisierte…