【干货】93页随机近似与强化学习教程分享(附PDF下载)

专知 2018-11-29 14:34
关注文章

【导读】随着Alpha Go的成功,强化学习始终是人们谈论的焦点。本文为大家编译了来自佛罗里达大学的Adithya M. Devraj分享的随机近似与强化学习教程,希望对大家的理论学习有所帮助。


介绍:


随机近似算法通常用来逼近固定点方程的解,其中涉及了函数未知分布的期望。该领域中,目前最着名的例子是TD和Q-Learning算法。


本次教程将从以下几个部分进行讲解:

  • 随机近似

  • 最快的随机近似方法

  • 随机动量优化

  • 强化学习

  • Zap Q-learning

  • 结论以及未来的工作


附PDF全文:(文末可下载)




微信扫一扫
关注该公众号

模型

暂无文件

文章被以下专辑收录
3844
{{panelTitle}}
支持Markdown和数学公式,公式格式:\\(...\\)或\\[...\\]

还没有内容

关注微信公众号