REBEL: Evolutionäre Methode entdeckt versteckte Wissensreste in LLMs
Die Forschung zum „Machine Unlearning“ für große Sprachmodelle (LLMs) hat ein neues Problem ans Licht gebracht: Die gängigen Evaluationsmetriken, die auf einfachen, harmlosen Abfragen basieren, können oft nur oberflächl…