MIR: Effiziente Erkundung in episodischem Multi-Agent RL durch Belohnung
In der Welt des Reinforcement Learning stellen episodische Belohnungen ein großes Problem dar: Sie sind selten und schwer zu erreichen, besonders wenn mehrere Agenten gleichzeitig handeln. Während intrinsische Belohnung…