展开全部

主编推荐语

本书将带你使用流行的Python库(例如TensorFlow和Keras)探索计算机视觉应用程序,从而掌握各种深度学习算法及其实现。

内容简介

本书开门见山,直接帮助你准备好训练高效深度学习模型的环境,以完成各种计算机视觉任务。书中介绍了常见的深度学习架构,如卷积神经网络和递归神经网络;讲述了如何利用深度学习进行图像分类、图像检索、目标检测、语义分割等内容。读完本书,你将能够开发和训练自己的深度学习模型,并用它们解决计算机视觉难题。

目录

  • 版权信息
  • 数字版权声明
  • 内容提要
  • 版权声明
  • 译者序
  • 前言
  • 第1章 入门
  • 1.1 理解深度学习
  • 1.1.1 感知机
  • 1.1.2 激活函数
  • 1.1.3 人工神经网络
  • 1.1.4 训练神经网络
  • 1.1.5 尝试TensorFlow游乐场
  • 1.1.6 卷积神经网络
  • 1.1.7 循环神经网络
  • 1.1.8 长短期记忆网络
  • 1.2 计算机视觉深度学习
  • 1.2.1 分类
  • 1.2.2 检测或定位与分割
  • 1.2.3 相似性学习
  • 1.2.4 图像题注
  • 1.2.5 生成模型
  • 1.2.6 视频分析
  • 1.3 建立开发环境
  • 1.3.1 硬件和操作系统
  • 1.3.2 安装软件包
  • 1.4 小结
  • 第2章 图像分类
  • 2.1 在TensorFlow中训练MNIST模型
  • 2.1.1 MNIST数据集
  • 2.1.2 加载MNIST数据
  • 2.1.3 建立一个感知机
  • 2.1.4 构建多层卷积网络
  • 2.2 在Keras中训练MNIST模型
  • 2.2.1 准备数据集
  • 2.2.2 构建模型
  • 2.3 其他流行的图像测试数据集
  • 2.3.1 CIFAR数据集
  • 2.3.2 Fashion-MNIST数据集
  • 2.3.3 ImageNet数据集和竞赛
  • 2.4 更大的深度学习模型
  • 2.4.1 AlexNet 模型
  • 2.4.2 VGG-16模型
  • 2.4.3 谷歌Inception-V3模型
  • 2.4.4 微软ResNet-50模型
  • 2.4.5 SqueezeNet模型
  • 2.4.6 空间变换网络模型
  • 2.4.7 DenseNet模型
  • 2.5 训练猫与狗的模型
  • 2.5.1 准备数据
  • 2.5.2 使用简单CNN进行基准测试
  • 2.5.3 增强数据集
  • 2.5.4 迁移学习或微调模型
  • 2.5.5 在深度学习中微调一些层
  • 2.6 开发现实世界的应用
  • 2.6.1 选择正确的模型
  • 2.6.2 处理欠拟合和过拟合场景
  • 2.6.3 从面部检测性别和年龄
  • 2.6.4 微调服装模型
  • 2.6.5 品牌安全
  • 2.7 小结
  • 第3章 图像检索
  • 3.1 理解视觉特征
  • 3.1.1 深度学习模型的可视化激活
  • 3.1.2 嵌入可视化
  • 3.1.3 DeepDream
  • 3.1.4 对抗样本
  • 3.2 模型推断
  • 3.2.1 导出模型
  • 3.2.2 提供训练好的模型
  • 3.3 基于内容的图像检索
  • 3.3.1 构建检索流水线
  • 3.3.2 有效的检索
  • 3.3.3 使用自编码器去噪
  • 3.4 小结
  • 第4章 目标检测
  • 4.1 检测图像中的目标
  • 4.2 探索数据集
  • 4.2.1 ImageNet数据集
  • 4.2.2 PASCAL VOC挑战
  • 4.2.3 COCO目标检测挑战
  • 4.2.4 使用指标评估数据集
  • 4.3 目标定位算法
  • 4.3.1 使用滑动窗口定位目标
  • 4.3.2 将定位看作回归问题
  • 4.4 检测目标
  • 4.4.1 R-CNN(区域卷积神经网络)
  • 4.4.2 Fast R-CNN
  • 4.4.3 Faster R-CNN
  • 4.4.4 SSD(单射多框探测器)
  • 4.5 目标检测API
  • 4.5.1 安装和设置
  • 4.5.2 预训练模型
  • 4.5.3 重新训练目标检测模型
  • 4.5.4 为自动驾驶汽车训练行人检测
  • 4.6 YOLO目标检测算法
  • 4.7 小结
  • 第5章 语义分割
  • 5.1 预测像素
  • 5.1.1 诊断医学图像
  • 5.1.2 通过卫星图像了解地球
  • 5.1.3 提供机器人视觉
  • 5.2 数据集
  • 5.3 语义分割算法
  • 5.3.1 全卷积网络
  • 5.3.2 SegNet架构
  • 5.3.3 膨胀卷积
  • 5.3.4 DeepLab
  • 5.3.5 RefiNet
  • 5.3.6 PSPnet
  • 5.3.7 大卷积核的重要性
  • 5.3.8 DeepLab v3
  • 5.4 超神经分割
  • 5.5 分割卫星图像
  • 为分割建模FCN
  • 5.6 分割实例
  • 5.7 小结
  • 第6章 相似性学习
  • 6.1 相似性学习算法
  • 6.1.1 孪生网络
  • 6.1.2 FaceNet模型
  • 6.1.3 DeepNet模型
  • 6.1.4 DeepRank 模型
  • 6.1.5 视觉推荐系统
  • 6.2 人脸分析
  • 6.2.1 人脸检测
  • 6.2.2 人脸特征点和属性
  • 6.2.3 人脸识别
  • 6.2.4 人脸聚类
  • 6.3 小结
  • 第7章 图像题注
  • 7.1 了解问题和数据集
  • 7.2 理解图像题注的自然语言处理
  • 7.2.1 用向量形式表达词
  • 7.2.2 将词转换为向量
  • 7.2.3 训练一个嵌入
  • 7.3 图像题注和相关问题的方法
  • 7.3.1 使用条件随机场来链接图像和文本
  • 7.3.2 在CNN特征上使用RNN生成题注
  • 7.3.3 使用图像排序创建题注
  • 7.3.4 从图像检索题注与从题注检索图像
  • 7.3.5 密集题注
  • 7.3.6 使用RNN生成题注
  • 7.3.7 使用多模态度量空间
  • 7.3.8 使用注意网络生成题注
  • 7.3.9 知道什么时候查看
  • 7.4 实现基于注意力的图像题注
  • 7.5 小结
  • 第8章 生成模型
  • 8.1 生成模型的应用
  • 8.1.1 艺术风格迁移
  • 8.1.2 预测视频中的下一帧
  • 8.1.3 图像的超分辨率
  • 8.1.4 交互式图像生成
  • 8.1.5 图像到图像的翻译
  • 8.1.6 文本到图像的生成
  • 8.1.7 图像修复
  • 8.1.8 图像混合
  • 8.1.9 转换属性
  • 8.1.10 创建训练数据
  • 8.1.11 创建新的动画角色
  • 8.1.12 照片3D模型
  • 8.2 神经艺术风格迁移
  • 8.2.1 内容损失
  • 8.2.2 使用Gram矩阵的风格损失
  • 8.2.3 风格迁移
  • 8.3 生成对抗网络
  • 8.3.1 vanilla GAN
  • 8.3.2 条件GAN
  • 8.3.3 对抗损失
  • 8.3.4 图像翻译
  • 8.3.5 InfoGAN
  • 8.3.6 GAN的缺点
  • 8.4 视觉对话模型
  • VDM算法
  • 8.5 小结
  • 第9章 视频分类
  • 9.1 了解视频和视频分类
  • 9.1.1 探索视频分类数据集
  • 9.1.2 将视频分割成帧
  • 9.1.3 视频分类方法
  • 9.2 将基于图像的方法扩展到视频
  • 9.2.1 人体姿态回归
  • 9.2.2 视频分割
  • 9.2.3 视频题注
  • 9.2.4 视频生成
  • 9.3 小结
  • 第10章 部署
  • 10.1 模型的性能
  • 10.1.1 量化模型
  • 10.1.2 MobileNets
  • 10.2 云部署
  • 10.2.1 AWS
  • 10.2.2 Google云平台
  • 10.3 在设备中部署模型
  • 10.3.1 Jetson TX2
  • 10.3.2 Android
  • 10.3.3 iPhone
  • 10.4 小结
展开全部

评分及书评

2.7
3个评分
  • 用户头像
    给这本书评了
    5.0

    本书开门见山,直接帮助你准备好训练高效深度学习模型的环境,以完成各种计算机视觉任务。书中介绍了常见的深度学习架构,如卷积神经网络和递归神经网络;讲述了如何利用深度学习进行图像分类、图像检索、目标检测、语义分割等内容。读完本书,你将能够开发和训练自己的深度学习模型,并用它们解决计算机视觉难题。

      转发
      评论

    出版方

    人民邮电出版社·图灵出品

    图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。