InfoReasoner: KI nutzt synthetische Belohnung zur besseren Informationssuche
Ein neues Forschungsprojekt namens InfoReasoner zeigt, wie große Sprachmodelle ihre Fähigkeit zur aktiven Informationssuche verbessern können. Durch die Einführung einer synthetischen Belohnung, die den semantischen Inf…