Adversarial Reward and Policy learning Via Variational Inverse Optimal Control

A. Qureshi, M.C. Yip
Bay Area Machine Learning Symposium – BayLearn 2018, Menlo Park, CA, August 13, 2018.
2018
http://proceedings.mlr.press/v78/das17a/das17a.pdf