The Thinking Spectrum: An Emperical Study of Tunable Reasoning in LLMs through Model Merging
Anzeige
Ähnliche Artikel
arXiv – cs.LG
•
Leichtgewichtiges Modell für Denken: Dynamisches Pruning & Distillation
arXiv – cs.AI
•
SPAN: Benchmark für interkalenderische Zeitlogik von LLMs
arXiv – cs.AI
•
Mechanics of Learned Reasoning 1: TempoBench, A Benchmark for Interpretable Deconstruction of Reasoning System Performance
arXiv – cs.AI
•
Rethinking Toxicity Evaluation in Large Language Models: A Multi-Label Perspective
arXiv – cs.AI
•
HardcoreLogic: Benchmark prüft Logikmodelle mit seltenen Rätselvarianten
arXiv – cs.AI
•
FATHOMS-RAG: A Framework for the Assessment of Thinking and Observation in Multimodal Systems that use Retrieval Augmented Generation