科技
类型
6.7
豆瓣评分
可以朗读
语音朗读
144千字
字数
2020-04-01
发行日期
展开全部
主编推荐语
以PyTorch为工具,在Python中实践深度强化学习。
内容简介
Pytorch是基于python且具备强大GPU加速的张量和动态神经网络,更是Python中优先的深度学习框架,它使用强大的GPU能力,提供最大的灵活性和速度。
本书指导读者以Pytorch为工具在Python中学习深层强化学习(DQN)。主要内容包括:强化学习概述及分类、强化学习的算法和实施方法、在Pytorch中实施深度规划与实现、“实施深层强化学习DQN”、理解并实施新的深层强化学习方法(Double-DQN、DuelingNetwork、PrioritizedExperienceReplay、A3C、A2C)。
目录
- 版权信息
- 译者序
- 前言
- 第1章 强化学习概述
- 1.1 机器学习的分类(监督学习、非监督学习、强化学习)
- 1.1.1 术语整理
- 1.1.2 监督学习、非监督学习、强化学习
- 1.2 强化学习、深度强化学习的历史
- 1.2.1 强化学习和大脑学习
- 1.2.2 强化学习和深度学习的结合
- 1.3 深度强化学习的应用实例
- 1.3.1 深度强化学习的应用实例
- 1.3.2 深度强化学习的未来前景
- 参考文献
- 第2章 在走迷宫任务中实现强化学习
- 2.1 Try Jupyter的使用方法
- 2.1.1 强化学习的实现和执行环境
- 2.1.2 Try Jupyter的介绍
- 2.2 迷宫和智能体的实现
- 2.2.1 迷宫的实现
- 2.2.2 智能体的实现
- 2.3 策略迭代法的实现
- 2.3.1 策略迭代法与价值迭代法
- 2.3.2 根据策略梯度法移动智能体
- 2.3.3 根据策略梯度法更新策略
- 2.3.4 策略梯度法的相关理论
- 2.4 价值迭代法的术语整理
- 2.4.1 奖励
- 2.4.2 动作价值和状态价值
- 2.4.3 贝尔曼方程和马尔可夫决策过程
- 2.5 Sarsa的实现
- 2.5.1 用ε-贪婪法实现策略
- 2.5.2 使用Sarsa算法更新动作价值函数Q(s,a)
- 2.5.3 用Sarsa解决迷宫问题的实现
- 2.6 实现Q学习
- 2.6.1 Q学习算法
- 2.6.2 Q学习的实现
- 参考文献
- 第3章 在倒立摆任务中实现强化学习
- 3.1 在本地PC上准备强化学习的实现和执行环境
- 3.1.1 安装Anaconda并配置Python执行环境
- 3.1.2 安装强化学习所需的库
- 3.2 倒立摆任务“CartPole”
- 3.2.1 关于CartPole
- 3.2.2 CartPole的实现
- 3.3 由多变量连续值表示的状态的表格表示
- 3.3.1 CartPole的状态
- 3.3.2 状态离散化的实现
- 3.4 Q学习的实现
- 参考文献
- 第4章 使用PyTorch实现深度学习
- 4.1 神经网络和深度学习的历史
- 4.1.1 第一次神经网络热潮
- 4.1.2 第二次神经网络热潮
- 4.1.3 第三次神经网络热潮
- 4.2 深度学习的计算方法
- 4.2.1 推理阶段
- 4.2.2 学习阶段
- 4.3 使用PyTorch实现MNIST手写数字分类任务
- 4.3.1 关于PyTorch
- 4.3.2 准备PyTorch的执行环境
- 4.3.3 获取MNIST数据
- 4.3.4 使用PyTorch实现深度学习
- 4.3.5 关于如何使用PyTorch的补充
- 参考文献
- 第5章 深度强化学习DQN的实现
- 5.1 深度强化学习DQN(深度Q网络)的说明
- 5.1.1 表格表示问题
- 5.1.2 深度强化学习DQN的说明
- 5.2 实现DQN的四个要点
- 5.3 实现DQN(上)
- 5.3.1 使用PyTorch实现DQN时需要注意的事项
- 5.3.2 DQN的实现
- 5.4 实现DQN(下)
- 第6章 实现深度强化学习的改进版
- 6.1 深度强化学习算法发展图
- 6.2 DDQN的实现
- 6.2.1 DDQN概述
- 6.2.2 DDQN的实现
- 6.3 Dueling Network的实现
- 6.3.1 Dueling Network概述
- 6.3.2 Dueling Network的实现
- 6.4 优先经验回放的实现
- 6.4.1 优先经验回放概述
- 6.4.2 实现优先经验回放
- 6.5 A2C的实现
- 6.5.1 A2C概述
- 6.5.2 A2C的实现
- 参考文献
- 第7章 在AWS GPU环境中实现消砖块游戏
- 7.1 消砖块游戏“Breakout”的描述
- 7.2 准备在AWS上使用GPU所需要的深度学习执行环境
- 7.2.1 创建AWS账户
- 7.2.2 Ubuntu终端的安装
- 7.2.3 创建用于与虚拟服务器通信的密钥
- 7.2.4 在AWS上构建用于执行深度学习的虚拟服务器
- 7.2.5 准备Breakout的执行环境
- 7.3 学习Breakout的四个关键思想
- 7.3.1 设置本地PC的环境
- 7.3.2 学习Breakout的关键思想
- 7.4 A2C的实现(上)
- 7.5 A2C的实现(下)
- 参考文献
- 后记
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。