科技
类型
7.4
豆瓣评分
可以朗读
语音朗读
250千字
字数
2016-07-01
发行日期
展开全部
主编推荐语
首次以深度学习为主线介绍语音识别应用的书籍,对你了解语音识别技术及其发展历程有重要的参考价值。
内容简介
全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括“深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。
本书适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读,所有的算法及技术细节都提供了详尽的参考文献,给出了深度学习在语音识别中应用的全景。
目录
- 版权信息
- 内容简介
- 作者及译者简介
- 译者序
- 序
- 前言
- 术语缩写
- 符号
- 1 简介
- 1.1 自动语音识别:更好的沟通之桥
- 1.2 语音识别系统的基本结构
- 1.3 全书结构
- 第一部分 传统声学模型
- 2 混合高斯模型
- 2.1 随机变量
- 2.2 高斯分布和混合高斯随机变量
- 2.3 参数估计
- 2.4 采用混合高斯分布对语音特征建模
- 3 隐马尔可夫模型及其变体
- 3.1 介绍
- 3.2 马尔可夫链
- 3.3 序列与模型
- 3.4 期望最大化算法及其在学习HMM参数中的应用
- 3.5 用于解码HMM状态序列的维特比算法
- 3.6 隐马尔可夫模型和生成语音识别模型的变体
- 第二部分 深度神经网络
- 4 深度神经网络
- 4.1 深度神经网络框架
- 4.2 使用误差反向传播来进行参数训练
- 4.3 实际应用
- 5 高级模型初始化技术
- 5.1 受限玻尔兹曼机
- 5.2 深度置信网络预训练
- 5.3 降噪自动编码器预训练
- 5.4 鉴别性预训练
- 5.5 混合预训练
- 5.6 采用丢弃法的预训练
- 第三部分 语音识别中的深度神经网络–隐马尔可夫混合模型
- 6 深度神经网络–隐马尔可夫模型混合系统
- 6.1 DNN-HMM混合系统
- 6.2 CD-DNN-HMM的关键模块及分析
- 6.3 基于KL距离的隐马尔可夫模型
- 7 训练和解码的加速
- 7.1 训练加速
- 7.2 加速解码
- 8 深度神经网络序列鉴别性训练
- 8.1 序列鉴别性训练准则
- 8.2 具体实现中的考量
- 8.3 噪声对比估计
- 第四部分 深度神经网络中的特征表示学习
- 9 深度神经网络中的特征表示学习
- 9.1 特征和分类器的联合学习
- 9.2 特征层级
- 9.3 使用随意输入特征的灵活性
- 9.4 特征的鲁棒性
- 9.5 对环境的鲁棒性
- 9.6 缺乏严重信号失真情况下的推广能力
- 10 深度神经网络和混合高斯模型的融合
- 10.1 在GMM-HMM系统中使用由DNN衍生的特征
- 10.2 识别结果融合技术
- 10.3 帧级别的声学分数融合
- 10.4 多流语音识别
- 11 深度神经网络的自适应技术
- 11.1 深度神经网络中的自适应问题
- 11.2 线性变换
- 11.3 线性隐层网络
- 11.4 保守训练
- 11.5 子空间方法
- 11.6 DNN说话人自适应的效果
- 第五部分 先进的深度学习模型
- 12 深度神经网络中的表征共享和迁移
- 12.1 多任务和迁移学习
- 12.2 多语言和跨语言语音识别
- 12.3 语音识别中深度神经网络的多目标学习
- 12.4 使用视听信息的鲁棒语音识别
- 13 循环神经网络及相关模型
- 13.1 介绍
- 13.2 基本循环神经网络中的状态-空间公式
- 13.3 沿时反向传播学习算法
- 13.4 一种用于学习循环神经网络的原始对偶技术
- 13.5 结合长短时记忆单元(LSTM)的循环神经网络
- 13.6 循环神经网络的对比分析
- 13.7 讨论
- 14 计算型网络
- 14.1 计算型网络
- 14.2 前向计算
- 14.3 模型训练
- 14.4 典型的计算节点
- 14.5 卷积神经网络
- 14.6 循环连接
- 15 总结及未来研究方向
- 15.1 路线图
- 15.2 技术前沿和未来方向
- 参考文献
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。