The Thinking Spectrum: An Emperical Study of Tunable Reasoning in LLMs through Model Merging
Anzeige
Ähnliche Artikel
arXiv – cs.AI
•
GUITester: Automatisierte GUI‑Tests mit KI – neue Benchmark und Framework
arXiv – cs.AI
•
ToolForge: KI-Training ohne echte API-Aufrufe – Mehrschichtige Daten‑Synthese
arXiv – cs.AI
•
A^2Flow: Automatisierte Agenten-Workflow-Generierung mit adaptiven Operatoren
arXiv – cs.LG
•
Leichtgewichtiges Modell für Denken: Dynamisches Pruning & Distillation
arXiv – cs.AI
•
SPAN: Benchmark für interkalenderische Zeitlogik von LLMs
arXiv – cs.AI
•
Mechanics of Learned Reasoning 1: TempoBench, A Benchmark for Interpretable Deconstruction of Reasoning System Performance