Neues Transformer-basiertes Verfahren zur automatischen Architektursuche
Ein neu veröffentlichter Ansatz nutzt die Transformer-Architektur, um neuronale Netzwerke für maschinelle Übersetzung systematisch zu optimieren. Dabei werden verschiedene Kombinationen von Encoder- und Decoder‑Köpfen u…