RefineRL: LLMs optimieren Competitive Programming durch selbstständige Iteration
Die neuesten Fortschritte bei großen Sprachmodellen (LLMs) zeigen, dass sie bereits komplexe Aufgaben wie Competitive Programming meistern können. Bisher konzentrieren sich die meisten Ansätze jedoch auf Einmalversuche…