PRISM: Menschliche Anweisungen verfeinern Robotik‑Behauptungen – neue Methode
Ein neues Verfahren namens PRISM kombiniert die Stärken von Imitation Learning (IL) und Reinforcement Learning (RL), um Robotermanipulationen präziser zu steuern. Dabei wird zunächst eine generische Imitationspolicy a…