2.7 用户推荐指数
科技
类型
可以朗读
语音朗读
146千字
字数
2020-01-01
发行日期
展开全部
主编推荐语
本书将带你使用流行的Python库(例如TensorFlow和Keras)探索计算机视觉应用程序,从而掌握各种深度学习算法及其实现。
内容简介
本书开门见山,直接帮助你准备好训练高效深度学习模型的环境,以完成各种计算机视觉任务。书中介绍了常见的深度学习架构,如卷积神经网络和递归神经网络;讲述了如何利用深度学习进行图像分类、图像检索、目标检测、语义分割等内容。读完本书,你将能够开发和训练自己的深度学习模型,并用它们解决计算机视觉难题。
目录
- 版权信息
- 数字版权声明
- 内容提要
- 版权声明
- 译者序
- 序
- 前言
- 第1章 入门
- 1.1 理解深度学习
- 1.1.1 感知机
- 1.1.2 激活函数
- 1.1.3 人工神经网络
- 1.1.4 训练神经网络
- 1.1.5 尝试TensorFlow游乐场
- 1.1.6 卷积神经网络
- 1.1.7 循环神经网络
- 1.1.8 长短期记忆网络
- 1.2 计算机视觉深度学习
- 1.2.1 分类
- 1.2.2 检测或定位与分割
- 1.2.3 相似性学习
- 1.2.4 图像题注
- 1.2.5 生成模型
- 1.2.6 视频分析
- 1.3 建立开发环境
- 1.3.1 硬件和操作系统
- 1.3.2 安装软件包
- 1.4 小结
- 第2章 图像分类
- 2.1 在TensorFlow中训练MNIST模型
- 2.1.1 MNIST数据集
- 2.1.2 加载MNIST数据
- 2.1.3 建立一个感知机
- 2.1.4 构建多层卷积网络
- 2.2 在Keras中训练MNIST模型
- 2.2.1 准备数据集
- 2.2.2 构建模型
- 2.3 其他流行的图像测试数据集
- 2.3.1 CIFAR数据集
- 2.3.2 Fashion-MNIST数据集
- 2.3.3 ImageNet数据集和竞赛
- 2.4 更大的深度学习模型
- 2.4.1 AlexNet 模型
- 2.4.2 VGG-16模型
- 2.4.3 谷歌Inception-V3模型
- 2.4.4 微软ResNet-50模型
- 2.4.5 SqueezeNet模型
- 2.4.6 空间变换网络模型
- 2.4.7 DenseNet模型
- 2.5 训练猫与狗的模型
- 2.5.1 准备数据
- 2.5.2 使用简单CNN进行基准测试
- 2.5.3 增强数据集
- 2.5.4 迁移学习或微调模型
- 2.5.5 在深度学习中微调一些层
- 2.6 开发现实世界的应用
- 2.6.1 选择正确的模型
- 2.6.2 处理欠拟合和过拟合场景
- 2.6.3 从面部检测性别和年龄
- 2.6.4 微调服装模型
- 2.6.5 品牌安全
- 2.7 小结
- 第3章 图像检索
- 3.1 理解视觉特征
- 3.1.1 深度学习模型的可视化激活
- 3.1.2 嵌入可视化
- 3.1.3 DeepDream
- 3.1.4 对抗样本
- 3.2 模型推断
- 3.2.1 导出模型
- 3.2.2 提供训练好的模型
- 3.3 基于内容的图像检索
- 3.3.1 构建检索流水线
- 3.3.2 有效的检索
- 3.3.3 使用自编码器去噪
- 3.4 小结
- 第4章 目标检测
- 4.1 检测图像中的目标
- 4.2 探索数据集
- 4.2.1 ImageNet数据集
- 4.2.2 PASCAL VOC挑战
- 4.2.3 COCO目标检测挑战
- 4.2.4 使用指标评估数据集
- 4.3 目标定位算法
- 4.3.1 使用滑动窗口定位目标
- 4.3.2 将定位看作回归问题
- 4.4 检测目标
- 4.4.1 R-CNN(区域卷积神经网络)
- 4.4.2 Fast R-CNN
- 4.4.3 Faster R-CNN
- 4.4.4 SSD(单射多框探测器)
- 4.5 目标检测API
- 4.5.1 安装和设置
- 4.5.2 预训练模型
- 4.5.3 重新训练目标检测模型
- 4.5.4 为自动驾驶汽车训练行人检测
- 4.6 YOLO目标检测算法
- 4.7 小结
- 第5章 语义分割
- 5.1 预测像素
- 5.1.1 诊断医学图像
- 5.1.2 通过卫星图像了解地球
- 5.1.3 提供机器人视觉
- 5.2 数据集
- 5.3 语义分割算法
- 5.3.1 全卷积网络
- 5.3.2 SegNet架构
- 5.3.3 膨胀卷积
- 5.3.4 DeepLab
- 5.3.5 RefiNet
- 5.3.6 PSPnet
- 5.3.7 大卷积核的重要性
- 5.3.8 DeepLab v3
- 5.4 超神经分割
- 5.5 分割卫星图像
- 为分割建模FCN
- 5.6 分割实例
- 5.7 小结
- 第6章 相似性学习
- 6.1 相似性学习算法
- 6.1.1 孪生网络
- 6.1.2 FaceNet模型
- 6.1.3 DeepNet模型
- 6.1.4 DeepRank 模型
- 6.1.5 视觉推荐系统
- 6.2 人脸分析
- 6.2.1 人脸检测
- 6.2.2 人脸特征点和属性
- 6.2.3 人脸识别
- 6.2.4 人脸聚类
- 6.3 小结
- 第7章 图像题注
- 7.1 了解问题和数据集
- 7.2 理解图像题注的自然语言处理
- 7.2.1 用向量形式表达词
- 7.2.2 将词转换为向量
- 7.2.3 训练一个嵌入
- 7.3 图像题注和相关问题的方法
- 7.3.1 使用条件随机场来链接图像和文本
- 7.3.2 在CNN特征上使用RNN生成题注
- 7.3.3 使用图像排序创建题注
- 7.3.4 从图像检索题注与从题注检索图像
- 7.3.5 密集题注
- 7.3.6 使用RNN生成题注
- 7.3.7 使用多模态度量空间
- 7.3.8 使用注意网络生成题注
- 7.3.9 知道什么时候查看
- 7.4 实现基于注意力的图像题注
- 7.5 小结
- 第8章 生成模型
- 8.1 生成模型的应用
- 8.1.1 艺术风格迁移
- 8.1.2 预测视频中的下一帧
- 8.1.3 图像的超分辨率
- 8.1.4 交互式图像生成
- 8.1.5 图像到图像的翻译
- 8.1.6 文本到图像的生成
- 8.1.7 图像修复
- 8.1.8 图像混合
- 8.1.9 转换属性
- 8.1.10 创建训练数据
- 8.1.11 创建新的动画角色
- 8.1.12 照片3D模型
- 8.2 神经艺术风格迁移
- 8.2.1 内容损失
- 8.2.2 使用Gram矩阵的风格损失
- 8.2.3 风格迁移
- 8.3 生成对抗网络
- 8.3.1 vanilla GAN
- 8.3.2 条件GAN
- 8.3.3 对抗损失
- 8.3.4 图像翻译
- 8.3.5 InfoGAN
- 8.3.6 GAN的缺点
- 8.4 视觉对话模型
- VDM算法
- 8.5 小结
- 第9章 视频分类
- 9.1 了解视频和视频分类
- 9.1.1 探索视频分类数据集
- 9.1.2 将视频分割成帧
- 9.1.3 视频分类方法
- 9.2 将基于图像的方法扩展到视频
- 9.2.1 人体姿态回归
- 9.2.2 视频分割
- 9.2.3 视频题注
- 9.2.4 视频生成
- 9.3 小结
- 第10章 部署
- 10.1 模型的性能
- 10.1.1 量化模型
- 10.1.2 MobileNets
- 10.2 云部署
- 10.2.1 AWS
- 10.2.2 Google云平台
- 10.3 在设备中部署模型
- 10.3.1 Jetson TX2
- 10.3.2 Android
- 10.3.3 iPhone
- 10.4 小结
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。