Forschung
InfoReasoner: KI nutzt synthetische Belohnung zur besseren Informationssuche
Ein neues Forschungsprojekt namens InfoReasoner zeigt, wie große Sprachmodelle ihre Fähigkeit zur aktiven Informationssuche verbessern könn…
arXiv – cs.AI