Steuerung latenter Merkmale: Empirische Studie zur Aktivierungssteuerung von LLMs
Moderne Sprachmodelle benötigen eine präzise Steuerung ihres Verhaltens, um sicher und effektiv in vielfältigen Anwendungen eingesetzt werden zu können. Die Aktivierungssteuerung – ein Ansatz, bei dem gezielt die Aktivierung bestimmter neuronaler Komponenten angepasst wird – bietet hierfür vielversprechende Möglichkeiten.