Python代码:https://github.com/ShangtongZhang/reinforcement-learning-an-introduction
英文原版书籍下载:http://incompleteideas.net/book/the-book-2nd.html
作者:
理查德·S·萨顿是阿尔伯塔大学计算机科学教授和强化学习与人工智能 AITF 主席,也是 DeepMind 的杰出研究科学家。
安德鲁·G·巴托是马萨诸塞大学阿默斯特分校计算机与信息科学学院的荣誉退休教授。
描述:
这是一本广泛使用的强化学习教材的新版,内容大幅扩充和更新,涵盖了人工智能中最活跃的研究领域之一的强化学习。
强化学习是人工智能中最活跃的研究领域之一,它是一种计算学习方法,通过让一个智能体在与一个复杂、不确定的环境交互的过程中,尝试最大化它所获得的总奖励。在《强化学习》一书中,Richard Sutton 和 Andrew Barto 以清晰简洁的方式介绍了该领域的关键思想和算法。这本第二版在第一版的基础上进行了大幅的扩充和更新,增加了一些新的主题,并更新了一些已有的主题。
与第一版一样,这本第二版侧重于介绍核心的在线学习算法,将更多的数学内容放在阴影框中。第一部分涵盖了尽可能多的强化学习内容,但没有超出可以找到精确解的表格形式的情况。这一部分介绍的很多算法都是第二版新增的,包括 UCB,Expected Sarsa,和 Double Learning。第二部分将这些思想扩展到函数逼近的情况,增加了一些新的章节,涉及到人工神经网络和傅里叶基等主题,并对离策略学习和策略梯度方法进行了更深入的讨论。第三部分增加了一些新的章节,探讨了强化学习与心理学和神经科学的关系,以及更新了一些案例研究,包括 AlphaGo 和 AlphaGo Zero,Atari 游戏,和 IBM Watson 的下注策略。最后一章讨论了强化学习对未来社会的影响。
赞誉: