GRIP: Geometrische Routerbeschränkung für Unlearning bei Mixture-of-Experts
Die Sicherheit großer Sprachmodelle hängt zunehmend von der Fähigkeit ab, gezielt Wissen zu löschen – ein Prozess, der als Machine Unlearning bezeichnet wird. Für die neueste Architektur, die Mixture-of-Experts (MoE), s…