Kollaboration von Sprachmodellen über versteckte Zustände
Neues Forschungsergebnis aus dem Bereich des Reinforcement Learning (RL) zeigt, dass kleine, spezialisierte Sprachmodelle (SLMs) ohne große monolithische Modelle komplexes, strukturiertes Denken demonstrieren können. Du…