Deep Reinforcement Learning: Energie‑ und CO₂‑Effizienz bei Atari‑Benchmarks analysiert
In einer neuen Studie wurden die Energie- und CO₂‑Emissionen von sieben modernen Deep‑Reinforcement‑Learning‑Algorithmen – DQN, TRPO, A2C, ARS, PPO, RecurrentPPO und QR‑DQN – systematisch untersucht. Die Algorithmen wur…