ICML 2021

Poster

Tue 21:00

On Proximal Policy Optimization's Heavy-tailed Gradients
Saurabh Garg · Joshua Zhanson · Emilio Parisotto · Adarsh Prasad · Zico Kolter · Zachary Lipton · Sivaraman Balakrishnan · Ruslan Salakhutdinov · Pradeep Ravikumar

Oral

Tue 17:00

PsiPhi-Learning: Reinforcement Learning with Demonstrations using Successor Features and Inverse Temporal Difference Learning
Angelos Filos · Clare Lyle · Yarin Gal · Sergey Levine · Natasha Jaques · Gregory Farquhar

Poster

Tue 21:00

PsiPhi-Learning: Reinforcement Learning with Demonstrations using Successor Features and Inverse Temporal Difference Learning
Angelos Filos · Clare Lyle · Yarin Gal · Sergey Levine · Natasha Jaques · Gregory Farquhar

Spotlight

Tue 19:45

SCC: an efficient deep reinforcement learning agent mastering the game of StarCraft II
Xiangjun Wang · Junxiao SONG · Penghui Qi · Peng Peng · Zhenkun Tang · Wei Zhang · Weimin Li · Xiongjun Pi · Jujie He · Chao Gao · Haitao Long · Quan Yuan

Poster

Tue 21:00

SCC: an efficient deep reinforcement learning agent mastering the game of StarCraft II
Xiangjun Wang · Junxiao SONG · Penghui Qi · Peng Peng · Zhenkun Tang · Wei Zhang · Weimin Li · Xiongjun Pi · Jujie He · Chao Gao · Haitao Long · Quan Yuan

Spotlight

Wed 5:45

Data-efficient Hindsight Off-policy Option Learning
Markus Wulfmeier · Dushyant Rao · Roland Hafner · Thomas Lampe · Abbas Abdolmaleki · Tim Hertweck · Michael Neunert · Dhruva Tirumala Bukkapatnam · Noah Siegel · Nicolas Heess · Martin Riedmiller

Spotlight

Tue 7:40

Counterfactual Credit Assignment in Model-Free Reinforcement Learning
Thomas Mesnard · Theophane Weber · Fabio Viola · Shantanu Thakoor · Alaa Saade · Anna Harutyunyan · Will Dabney · Thomas Stepleton · Nicolas Heess · Arthur Guez · Eric Moulines · Marcus Hutter · Lars Buesing · Remi Munos

Poster

Wed 9:00

Data-efficient Hindsight Off-policy Option Learning
Markus Wulfmeier · Dushyant Rao · Roland Hafner · Thomas Lampe · Abbas Abdolmaleki · Tim Hertweck · Michael Neunert · Dhruva Tirumala Bukkapatnam · Noah Siegel · Nicolas Heess · Martin Riedmiller

Poster

Tue 9:00

Counterfactual Credit Assignment in Model-Free Reinforcement Learning
Thomas Mesnard · Theophane Weber · Fabio Viola · Shantanu Thakoor · Alaa Saade · Anna Harutyunyan · Will Dabney · Thomas Stepleton · Nicolas Heess · Arthur Guez · Eric Moulines · Marcus Hutter · Lars Buesing · Remi Munos

Spotlight

Tue 17:45

Discovering symbolic policies with deep reinforcement learning
Mikel Landajuela Larma · Brenden Petersen · Sookyung Kim · Claudio Santiago · Ruben Glatt · Nathan Mundhenk · Jacob Pettit · Daniel Faissol

Poster

Tue 21:00

Discovering symbolic policies with deep reinforcement learning
Mikel Landajuela Larma · Brenden Petersen · Sookyung Kim · Claudio Santiago · Ruben Glatt · Nathan Mundhenk · Jacob Pettit · Daniel Faissol

Main Navigation

119 Results