Misc.

Stochastic Value Gradient (SVG) (Heess et al., 2015)
Q-Prop (Gu et al., 2016b)
Normalized Advantage Function (NAF) (Gu et al., 2016a)
Fictitious Self-Play (FSP) (Heinrich et al., 2015; Heinrich and Silver, 2016)