Neues Paper: Komposition von neuronalen Netzen bestimmt Optimierungsverhalten
Ein brandneues arXiv‑Veröffentlichung beleuchtet, wie die Komposition von neuronalen Netzen das Optimierungs‑Landschaft und die Trainingsdynamik prägt. Die Autoren untersuchen den Gradientenfluss bei überparametrisierten Optimierungsproblemen, die als Training eines Netzes mit linearen Aktivierungen interpretiert werden können.