Supervised Reinforcement Learning: Google AI zeigt, wie kleine Modelle komplexe Aufgaben meistern
Google Cloud AI Research in Zusammenarbeit mit der UCLA hat ein neues Trainingsframework namens Supervised Reinforcement Learning (SRL) vorgestellt. SRL ermöglicht es kleinen Sprachmodellen – etwa 7 Billionen Parameter groß – komplexe Aufgaben zu erlernen, ohne sich ausschließlich auf reine Nachahmung oder korrekte Rollouts zu verlassen.