展开全部

主编推荐语

带你深入数字人世界,掌握AIGC时代的创新开发之道。

内容简介

本书是一部系统介绍AI数字人技术的专业著作,涵盖了数字人的定义、发展历程、关键技术及应用实践等内容,全书共分三部分。

在技术基础部分,首先介绍了数字人的定义、发展历程、分类和应用场景,接着详细解析了数字人系统的架构设计、视觉算法和语音合成技术的原理,以及语义理解和知识表示技术如何提升数字人的智能和表现力。

在应用实践部分,带领读者深入探索数字人的创作流程,从内容策划、角色建模到交互设计,每一步都进行了详细讲解。此外,还讨论了数字人的身份认知和技术规范,为数字人的应用实践提供了必要的知识。

在展望未来部分,探讨了数字人技术的未来发展趋势,为读者描绘了数字人与人类和谐共生的美好蓝图。

目录

  • 版权信息
  • 内容提要
  • 赞誉
  • 前言
  • 资源与支持
  • 技术基础
  • 第1章 数字人概述
  • 1.1 什么是数字人
  • 1.1.1 数字人的定义
  • 1.1.2 数字人的特征
  • 1.2 数字人的发展历史
  • 1.2.1 早期虚拟角色
  • 1.2.2 人工智能与数字人的融合
  • 1.3 数字人的分类
  • 1.3.1 根据外观分类
  • 1.3.2 根据用途分类
  • 1.3.3 根据智能级别分类
  • 1.4 数字人的应用场景
  • 1.4.1 娱乐场景
  • 1.4.2 教育场景
  • 1.4.3 客服场景
  • 1.5 数字人技术的发展趋势
  • 1.6 数字人的社会影响
  • 1.7 本章小结
  • 第2章 数字人系统的架构
  • 2.1 系统的组成模块
  • 2.1.1 输入模块
  • 2.1.2 内容生成模块
  • 2.1.3 渲染模块
  • 2.1.4 交互模块
  • 2.2 多模态信息融合流程
  • 2.2.1 文本生成
  • 2.2.2 语音合成
  • 2.2.3 表情映射
  • 2.2.4 唇型同步
  • 2.3 数字人云服务架构
  • 2.3.1 云平台选型
  • 2.3.2 模型仓库
  • 2.3.3 多模态处理
  • 2.3.4 在线服务
  • 2.4 数字人的数据表示
  • 2.4.1 文本数据表示
  • 2.4.2 音频数据表示
  • 2.4.3 视频数据表示
  • 2.4.4 多模态数据表示
  • 2.5 本章小结
  • 第3章 数字人视觉算法
  • 3.1 3D人脸建模
  • 3.1.1 建模流程
  • 3.1.2 参数调整
  • 3.1.3 3D人脸重建技术
  • 3.1.4 建模软件比较
  • 3.2 表情分析
  • 3.2.1 表情识别
  • 3.2.2 表情生成
  • 3.2.3 表情跟踪
  • 3.2.4 表情融合
  • 3.3 姿态估计
  • 3.3.1 2D姿态估计
  • 3.3.2 3D姿态估计
  • 3.3.3 手势估计
  • 3.3.4 手势生成
  • 3.4 唇型检测和口型匹配
  • 3.4.1 2D唇型检测
  • 3.4.2 2D口型匹配
  • 3.4.3 3D唇型检测
  • 3.4.4 3D口型匹配
  • 3.4.5 唇型同步评价
  • 3.5 本章小结
  • 第4章 数字人语音合成
  • 4.1 语音数字化原理
  • 4.1.1 音频采样
  • 4.1.2 语音编码
  • 4.2 基于拼接的语音合成
  • 4.2.1 段音拼接
  • 4.2.2 语音跨段平滑
  • 4.3 基于深度学习的语音合成
  • 4.3.1 LSTM在语音合成中的应用
  • 4.3.2 基于注意力机制的Tacotron模型
  • 4.3.3 Tacotron2与WaveNet集成
  • 4.3.4 基于Transformer的语音合成
  • 4.3.5 基于非自回归结构的实时语音合成
  • 4.4 语音风格迁移
  • 4.4.1 声纹提取
  • 4.4.2 风格转换
  • 4.5 个性化语音合成
  • 4.6 语音风格增强
  • 4.7 多语种语音合成
  • 4.7.1 多语言模型训练
  • 4.7.2 语言嵌入
  • 4.7.3 语言自适应模型
  • 4.7.4 语音后处理
  • 4.8 本章小结
  • 第5章 数字人语义理解
  • 5.1 语义解析
  • 5.1.1 词法分析
  • 5.1.2 句法分析
  • 5.1.3 语义分析
  • 5.2 情感分析
  • 5.2.1 情感识别
  • 5.2.2 情感分类
  • 5.3 语义编码器-解码器
  • 5.3.1 编码器架构
  • 5.3.2 解码器架构
  • 5.3.3 注意力机制
  • 5.3.4 应用场景
  • 5.4 本章小结
  • 第6章 数字人知识表示
  • 6.1 知识表示基础
  • 6.1.1 符号主义知识表示
  • 6.1.2 连接主义知识表示
  • 6.1.3 图数据库知识表示
  • 6.2 预训练语言模型
  • 6.2.1 模型架构
  • 6.2.2 能力提升
  • 6.2.3 功能拓展
  • 6.3 数字人知识的应用
  • 6.3.1 自然语言理解
  • 6.3.2 对话系统
  • 6.3.3 数字人人格化
  • 6.4 本章小结
  • 应用实践
  • 第7章 数字人创作流程
  • 7.1 创作流程概览
  • 7.1.1 数字人创作的7个阶段
  • 7.1.2 创作流程的优化策略
  • 7.1.3 创作准备工作
  • 7.2 数字人形象设计
  • 7.2.1 外观设计
  • 7.2.2 面部建模
  • 7.2.3 动作设计
  • 7.3 语音内容生成
  • 7.3.1 语音素材收集与处理
  • 7.3.2 实现语音合成
  • 7.3.3 个性化语音风格设计
  • 7.3.4 数字人语音生成实例
  • 7.4 表情及动作生成
  • 7.4.1 实现动作捕捉
  • 7.4.2 实现表情映射
  • 7.4.3 实现动作生成
  • 7.4.4 数字人表情及动作生成实例
  • 7.5 语音及视频合成
  • 7.5.1 语音驱动的唇型动画
  • 7.5.2 体积感渲染
  • 7.5.3 数字人语音及视频合成实例
  • 7.6 内容编辑和后期制作
  • 7.6.1 视频编辑
  • 7.6.2 后期特效制作
  • 7.6.3 渲染与输出
  • 7.6.4 数字人后期编辑与渲染实例
  • 7.7 交互设计与内容运营
  • 7.7.1 交互设计
  • 7.7.2 内容运营策略
  • 7.7.3 数字人交互设计与内容运营实例
  • 7.8 本章小结
  • 第8章 数字人身份认知
  • 8.1 数字人的身份定位
  • 8.1.1 个体或工具
  • 8.1.2 数字人的角色定位
  • 8.2 数字人的权利保障
  • 8.2.1 知识产权
  • 8.2.2 隐私权
  • 8.3 数字人的成长与没落
  • 8.3.1 持续学习
  • 8.3.2 版本迭代
  • 8.4 数字人的伦理问题
  • 8.4.1 摒弃偏见和歧视
  • 8.4.2 透明可解释性
  • 8.4.3 尊重多样性
  • 8.5 本章小结
  • 第9章 数字人技术规范
  • 9.1 数字人信息安全规范
  • 9.1.1 数据隔离规范
  • 9.1.2 访问控制规范
  • 9.2 数字人内容审核规范
  • 9.2.1 内容审核方式
  • 9.2.2 违规处理机制
  • 9.3 数字人应用管理规范
  • 9.3.1 应用接入管理
  • 9.3.2 应用监测与审计
  • 9.4 本章小结
  • 展望未来
  • 第10章 人机共生
  • 10.1 人机共生的美好时代
  • 10.1.1 人机共生的定义与理念
  • 10.1.2 人机共生时代的社会生态
  • 10.2 数字人与人类的深度互动
  • 10.2.1 互动模式的多样性
  • 10.2.2 数字人与人类文化的交融
  • 10.3 社区共建
  • 10.3.1 数字人与人类社区的融合
  • 10.3.2 共同学习的平台与机制
  • 10.3.3 社区共建与数字人技术的创新
  • 10.4 本章小结
展开全部

评分及书评

尚无评分
目前还没人评分
  • 加载中...

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。