Multivariate Variational Autoencoder (MVAE) verbessert Rekonstruktion und Kalibrierung
Ein neues Modell, der Multivariate Variational Autoencoder (MVAE), wurde auf arXiv vorgestellt und verspricht, die Vorteile der klassischen VAE-Architektur zu erhalten, während gleichzeitig die Beschränkung auf diagonale Posterior-Kovarianzen aufgehoben wird. Durch die Faktorisierung jeder Posterior-Kovarianz in eine globale Kopplungsmatrix und per‑Sample-Diagonal‑Skalen erzeugt der MVAE eine volle Kovarianzfamilie, die analytisch berechenbare KL‑Divergenzen und eine effiziente Reparametrisierung ermöglicht.
In umfangreichen Tests auf Larochelle‑Style‑MNIST, Fashion‑MNIST, CIFAR‑10 und CIFAR‑100 zeigte der MVAE konsistent bessere Rekonstruktionswerte (MSE sinkt) und signifikante Verbesserungen bei der Kalibrierung (NLL, Brier Score, ECE sinken). Darüber hinaus erzielte er höhere Werte bei unüberwachten Strukturanalysen (NMI, ARI steigen), insbesondere bei mittleren Latent‑Größen, wenn die Kapazität mit diagonalen VAE‑Modellen abgeglichen wurde.
Visualisierungen der Latent‑Pläne deuten auf sanftere, kohärentere Faktor‑Traversals und schärfere lokale Details hin. Die Autoren stellen eine vollständig reproduzierbare Implementierung mit Trainings‑ und Evaluationsskripten sowie Sweep‑Utilities bereit, um faire Vergleiche zu ermöglichen und die Nutzung in der Forschung zu erleichtern.