展开全部

主编推荐语

以PyTorch为工具,在Python中实践深度强化学习。

内容简介

Pytorch是基于python且具备强大GPU加速的张量和动态神经网络,更是Python中优先的深度学习框架,它使用强大的GPU能力,提供最大的灵活性和速度。

本书指导读者以Pytorch为工具在Python中学习深层强化学习(DQN)。主要内容包括:强化学习概述及分类、强化学习的算法和实施方法、在Pytorch中实施深度规划与实现、“实施深层强化学习DQN”、理解并实施新的深层强化学习方法(Double-DQN、DuelingNetwork、PrioritizedExperienceReplay、A3C、A2C)。

目录

  • 版权信息
  • 译者序
  • 前言
  • 第1章 强化学习概述
  • 1.1 机器学习的分类(监督学习、非监督学习、强化学习)
  • 1.1.1 术语整理
  • 1.1.2 监督学习、非监督学习、强化学习
  • 1.2 强化学习、深度强化学习的历史
  • 1.2.1 强化学习和大脑学习
  • 1.2.2 强化学习和深度学习的结合
  • 1.3 深度强化学习的应用实例
  • 1.3.1 深度强化学习的应用实例
  • 1.3.2 深度强化学习的未来前景
  • 参考文献
  • 第2章 在走迷宫任务中实现强化学习
  • 2.1 Try Jupyter的使用方法
  • 2.1.1 强化学习的实现和执行环境
  • 2.1.2 Try Jupyter的介绍
  • 2.2 迷宫和智能体的实现
  • 2.2.1 迷宫的实现
  • 2.2.2 智能体的实现
  • 2.3 策略迭代法的实现
  • 2.3.1 策略迭代法与价值迭代法
  • 2.3.2 根据策略梯度法移动智能体
  • 2.3.3 根据策略梯度法更新策略
  • 2.3.4 策略梯度法的相关理论
  • 2.4 价值迭代法的术语整理
  • 2.4.1 奖励
  • 2.4.2 动作价值和状态价值
  • 2.4.3 贝尔曼方程和马尔可夫决策过程
  • 2.5 Sarsa的实现
  • 2.5.1 用ε-贪婪法实现策略
  • 2.5.2 使用Sarsa算法更新动作价值函数Q(s,a)
  • 2.5.3 用Sarsa解决迷宫问题的实现
  • 2.6 实现Q学习
  • 2.6.1 Q学习算法
  • 2.6.2 Q学习的实现
  • 参考文献
  • 第3章 在倒立摆任务中实现强化学习
  • 3.1 在本地PC上准备强化学习的实现和执行环境
  • 3.1.1 安装Anaconda并配置Python执行环境
  • 3.1.2 安装强化学习所需的库
  • 3.2 倒立摆任务“CartPole”
  • 3.2.1 关于CartPole
  • 3.2.2 CartPole的实现
  • 3.3 由多变量连续值表示的状态的表格表示
  • 3.3.1 CartPole的状态
  • 3.3.2 状态离散化的实现
  • 3.4 Q学习的实现
  • 参考文献
  • 第4章 使用PyTorch实现深度学习
  • 4.1 神经网络和深度学习的历史
  • 4.1.1 第一次神经网络热潮
  • 4.1.2 第二次神经网络热潮
  • 4.1.3 第三次神经网络热潮
  • 4.2 深度学习的计算方法
  • 4.2.1 推理阶段
  • 4.2.2 学习阶段
  • 4.3 使用PyTorch实现MNIST手写数字分类任务
  • 4.3.1 关于PyTorch
  • 4.3.2 准备PyTorch的执行环境
  • 4.3.3 获取MNIST数据
  • 4.3.4 使用PyTorch实现深度学习
  • 4.3.5 关于如何使用PyTorch的补充
  • 参考文献
  • 第5章 深度强化学习DQN的实现
  • 5.1 深度强化学习DQN(深度Q网络)的说明
  • 5.1.1 表格表示问题
  • 5.1.2 深度强化学习DQN的说明
  • 5.2 实现DQN的四个要点
  • 5.3 实现DQN(上)
  • 5.3.1 使用PyTorch实现DQN时需要注意的事项
  • 5.3.2 DQN的实现
  • 5.4 实现DQN(下)
  • 第6章 实现深度强化学习的改进版
  • 6.1 深度强化学习算法发展图
  • 6.2 DDQN的实现
  • 6.2.1 DDQN概述
  • 6.2.2 DDQN的实现
  • 6.3 Dueling Network的实现
  • 6.3.1 Dueling Network概述
  • 6.3.2 Dueling Network的实现
  • 6.4 优先经验回放的实现
  • 6.4.1 优先经验回放概述
  • 6.4.2 实现优先经验回放
  • 6.5 A2C的实现
  • 6.5.1 A2C概述
  • 6.5.2 A2C的实现
  • 参考文献
  • 第7章 在AWS GPU环境中实现消砖块游戏
  • 7.1 消砖块游戏“Breakout”的描述
  • 7.2 准备在AWS上使用GPU所需要的深度学习执行环境
  • 7.2.1 创建AWS账户
  • 7.2.2 Ubuntu终端的安装
  • 7.2.3 创建用于与虚拟服务器通信的密钥
  • 7.2.4 在AWS上构建用于执行深度学习的虚拟服务器
  • 7.2.5 准备Breakout的执行环境
  • 7.3 学习Breakout的四个关键思想
  • 7.3.1 设置本地PC的环境
  • 7.3.2 学习Breakout的关键思想
  • 7.4 A2C的实现(上)
  • 7.5 A2C的实现(下)
  • 参考文献
  • 后记
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。