主编推荐语
微软搜索广告部五位业内资深应用科学家实战经验分享,全方位详细解读深度学习模型在互联网搜索、广告、对话机器人、电商等领域的应用实现。
内容简介
本书作者都是微软人工智能及研究院的研究人员和应用科学家,具有深厚的机器学习背景,在一线针对产品需求和支持的场景进行了大量的深度学习模型及算法的研究和开发,在模型设计、训练、评估、部署、推理优化等模型开发全生命周期积累了丰富的经验。 本书面向的读者是希望学习和运用深度学习模型到具体应用场景的企业工程师、科研院所的学生和科研人员。读者学习本书的目的是了解深度学习模型和算法基础后,重点应用和实践并快速部署在自己的工作领域,同时取得落地成果。
本书分为4个部分,共13章。其中第1部分(第1~2章)简要介绍了深度学习的现状、概念和实现工具。第2部分(第3~5章)以具体的实际应用展示基于深度学习技术进行工程实践和开发的流程和技巧。第3部分(第6~12章)介绍了学术界和工业界最新的高阶深度学习模型的实现和应用。第4部分(第13章)介绍了深度学习领域的一些前沿研究方向并对深度学习的未来发展进行展望。
本书作者都是微软人工智能及研究院的研究人员和应用科学家,具有深厚的机器学习背景,在一线针对产品需求和支持的场景进行了大量的深度学习模型及算法的研究和开发,在模型设计、训练、评估、部署、推理优化等模型开发全生命周期积累了丰富的经验。
目录
- 版权信息
- 序言
- 前言
- 人工智能热潮
- 机器学习发展路径
- 本书的初衷
- 本书内容定位
- 本书学习建议
- 第1章 神经网络发展史
- 1.1 神经网络的早期雏形
- 1.1.1 联结主义和Hebb学习规则
- 1.1.2 Oja学习规则及主分量分析
- 1.1.3 早期的神经元模型
- 1.2 现代神经网络
- 1.2.1 反向传播算法
- 1.2.2 神经网络的通用函数近似性
- 1.2.3 深度的必要性
- 1.3 深度学习发展历史中的重要神经网络
- 1.3.1 深度神经网络的兴起
- 1.3.2 自组织特征映射
- 1.3.3 霍普菲尔德神经网络
- 1.3.4 玻尔兹曼机及受限玻尔兹曼机
- 1.3.5 深度信念网
- 1.3.6 其他深度神经网络
- 1.4 本章小结
- 参考文献
- 第2章 深度学习开源框架
- 2.1 主流的深度学习开源框架
- 【知识点讲解】:编程模式与计算图
- Theano
- TensorFlow
- 【知识点讲解】分布式架构
- PyTorch
- MXNet
- CNTK
- 闲话ONNX
- 2.2 简单神经网络模型在不同框架上的实现对比
- TensorFlow
- Keras
- PyTorch
- MXNet-Gluon
- CNTK
- 2.3 本章小结
- 参考文献
- 第3章 多层感知机在自然语言处理方面的应用
- 3.1 词和文本模型的发展历程
- 3.2 Word2Vec模型:基于上下文的分布式表达
- 3.2.1 Skip-Gram算法的训练流程
- 3.2.2 Skip-Gram算法的网络结构
- 1.输入层
- 2.编码映射层
- 3.解码映射层
- 3.2.3 代价函数
- 3.3 应用TensorFlow实现Word2Vec模型
- 3.3.1 定义计算图:训练语料库预处理
- 3.3.2 模型计算图的实现
- 3.4 Word2Vec模型的局限及改进
- 3.5 本章小结
- 参考文献
- 第4章 卷积神经网络在图像分类中的应用
- 4.1 图像识别和图像分类的发展
- 4.2 AlexNet
- 4.2.1 网络模型结构
- 1.输入层
- 2.卷积层及池化层
- 4.2.2 AlexNet的具体改进
- 1.使用ReLU作为非线性激活函数
- 2.采用多GPU进行并行训练
- 3.局部响应归一化
- 4.使用存在重叠的池化感知域
- 5.Dropout
- 4.2.3 代价函数
- 4.3 应用TensorFlow实现AlexNet
- 4.3.1 读取训练图像集
- 4.3.2 模型计算图的实现
- 4.4 本章小结
- 参考文献
- 第5章 递归神经网络
- 5.1 递归神经网络应用背景介绍
- 5.2 递归神经网络模型介绍
- 5.2.1 递归神经网络模型结构
- 5.2.2 双向递归神经网络
- 5.2.3 长短期记忆模型
- 5.3 递归神经网络展望
- 5.4 本章小结
- 参考文献
- 第6章 DeepIntent模型在信息检索领域的应用
- 6.1 信息检索在搜索广告中的应用发展
- 6.2 含有注意力机制的RNN模型
- 6.2.1 网络模型结构
- 1.输入层
- 2.词嵌入层
- 3.RNN
- 4.基于注意力机制的pooling
- 6.2.2 代价函数
- 6.3 应用TensorFlow实现DeepIntent模型
- 6.3.1 定义计算图
- 1.输入层的实现
- 2.词嵌入层的实现
- 3.RNN的实现
- 4.基于注意力机制的池化层的实现
- 6.3.2 定义代价函数及优化算法
- 6.3.3 执行计算图进行训练
- 6.4 本章小结
- 参考文献
- 第7章 图像识别及在广告搜索方面的应用
- 7.1 视觉搜索
- 7.2 方法和系统
- 7.2.1 图像DNN编码器
- 7.2.2 利用Rich-CDSSM降低维度
- 7.2.3 快速最近邻搜索系统
- 7.2.4 精密层
- 7.2.5 端到端服务系统
- 7.3 评测
- 7.4 用于演示的Visual Shopping Assistant应用程序
- 7.5 相关工作
- 7.6 本章小结
- 第8章 Seq2Seq模型在聊天机器人中的应用
- 8.1 Seq2Seq模型应用背景
- 8.2 Seq2Seq模型的应用方法
- 8.3 含有注意力机制的多层Seq2Seq模型
- 8.3.1 词嵌入层
- 8.3.2 可变深度LSTM递归层
- 8.3.3 注意力机制层
- 8.3.4 投影层
- 8.3.5 损失函数(loss function)和端到端训练
- 【知识点讲解】注意力机制
- 【知识点讲解】概率估计
- 8.4 信息导向的自适应序列采样
- 8.5 多轮项目推荐
- 8.6 熵作为信心的度量
- 8.6.1 直观的定义和讨论
- 8.6.2 序列后验估计的不确定性
- 8.6.3 信息导向的抽样:最大化预期信息增益的原则
- 8.6.4 Seq2Seq模型的3个应用程序
- 8.6.5 应用程序1:查询理解和重写
- 1.What and How(什么和如何):问题理解
- 2.训练和数据
- 3.模型细节
- 4.结果和评估
- 5.重写质量
- 6.产品推荐的质量
- 7.讨论
- 8.6.6 应用程序2:相关性评分
- 1.训练和数据
- 2.模型细节
- 3.评估
- 4.讨论
- 8.6.7 应用程序3:聊天机器人
- 1.对话流和系统行为
- 2.问题制定
- 3.实施和定性反馈
- 8.7 本章小结
- 参考文献
- 第9章 word2vec的改进:fastText模型
- 9.1 fastText模型的原理
- 9.1.1 回顾Skip-Gram算法
- 9.1.2 subword模型
- 9.1.3 subword形态
- 9.1.4 分层softmax
- 9.1.5 fastText的模型架构
- 9.1.6 fastText算法实现
- 9.2 应用场景:搜索广告中的查询词关键词匹配问题
- 9.3 本章小结
- 参考文献
- 第10章 生成对抗网络
- 10.1 生成对抗网络的原理
- 10.1.1 GAN的基本模型
- 10.1.2 GAN优化目标的原理
- 10.1.3 GAN的训练
- 10.1.4 GAN的扩展模型
- DCGAN
- InfoGAN
- CGAN
- SeqGAN
- 10.2 应用场景:搜索广告中由查询词直接生成关键词
- 10.2.1 生成模型的构建
- 10.2.2 判别模型的构建
- 10.2.3 条件生成对抗网络的构建
- 10.3 本章小结
- 参考文献
- 第11章 深度强化学习
- 11.1 深度强化学习的原理
- 11.1.1 强化学习的基本概念
- 11.1.2 马尔可夫决策过程
- 11.1.3 价值函数和贝尔曼方程
- 11.1.4 策略迭代和值迭代
- 1.策略迭代(policy iteration)
- 2.值迭代(value iteration)
- 11.1.5 Q-Learning
- 11.1.6 深度Q网络
- 11.1.7 策略梯度
- 11.1.8 动作评价网络
- 11.2 应用场景:基于深度强化学习的推荐系统
- 11.3 本章小结
- 参考文献
- 第12章 工程实践和线上优化
- 12.1 Seq2Seq模型介绍
- 12.2 LSTM优化分析
- 12.2.1 优化一:指数运算的近似展开
- 12.2.2 优化二:矩阵运算的执行速度优化
- 知识点一:MKL与数据缓存
- 知识点二:MKL与矢量化
- 12.2.3 优化三:多线程并行处理
- 1.多线程处理多个数据样本
- 2.多线程处理矩阵运算
- 12.3 优化应用实例:RapidScorer算法对GBDT的加速
- 12.3.1 背景介绍
- 12.3.2 RapidScorer数据结构设计
- 1.优化“与”运算操作
- 2.等效节点合并
- 12.3.3 RapidScorer矢量化
- 12.3.4 RapidScorer实验结果
- 12.4 本章小结
- 参考文献
- 第13章 深度学习的下一个浪潮
- 13.1 深度学习的探索方向展望
- 13.1.1 设计更好的生成模型
- 13.1.2 深度强化学习的发展
- 13.1.3 半监督学习与深度学习
- 13.1.4 深度学习自身的学习
- 13.1.5 迁移学习与深度学习的结合
- 13.1.6 用于推理的深度学习
- 13.1.7 深度学习工具的标准化
- 13.2 深度学习的应用场景展望
- 13.2.1 医疗健康领域
- 1.疾病诊断
- 2.病患状态分析
- 3.病情咨询
- 4.药物研发
- 5.精准医疗
- 13.2.2 安全隐私领域
- 1.智能安防系统
- 2.智能行为分析系统
- 13.2.3 城市治理领域
- 1.智能交通控制
- 2.环境指标预测
- 3.人员密度预测
- 13.2.4 艺术创作领域
- 13.2.5 金融保险领域
- 1.收益预测
- 2.投资组合构建
- 3.风险管理
- 4.产品推荐
- 13.2.6 无人服务领域
- 1.无人车
- 2.无人店
- 3.机器人
- 13.3 本章小结
- 参考文献
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。