CircuitSeer: Mining High-Quality Data by Probing Mathematical Reasoning Circuits in LLMs
Anzeige
Ähnliche Artikel
arXiv – cs.LG
•
Thompson Sampling via Fine-Tuning of LLMs
arXiv – cs.AI
•
Modeling Transformers as complex networks to analyze learning dynamics
arXiv – cs.AI
•
Neue Methode TORSO nutzt interne Logik von LLMs ohne Beispiele
arXiv – cs.AI
•
Narrow Finetuning erhöht Risiko von emergentem Misalignment – Domänenabhängigkeit
arXiv – cs.AI
•
Ressourcenschonende Verstärkung für LLMs: One-Shot-Policy-Optimierung
arXiv – cs.AI
•
InfoReasoner: KI nutzt synthetische Belohnung zur besseren Informationssuche