Forschung
Stärkung des Chain-of-Thought-Reasonings durch selbstentwickelnde Rubriken
Chain-of-Thought (CoT) ist ein entscheidender Bestandteil der Argumentationsfähigkeit großer Sprachmodelle, doch die direkte Belohnung dies…
arXiv – cs.AI