人工智能
类型
可以朗读
语音朗读
140千字
字数
2022-01-01
发行日期
展开全部
主编推荐语
着重阐述深度学习时代的计算机视觉算法的工作原理。
内容简介
本书首先对深度学习与计算机视觉基础进行了介绍,之后对卷积神经网络结构的演化过程,以及基于深度学习的目标检测算法、图像分割算法、人体姿态估计算法、行人重识别与目标跟踪算法、人脸识别算法以及图像超分辨率重建方法进行了介绍。
本书系统讲解了在日常生活和工作中常见的几项计算机视觉任务,并着重介绍了在当今深度学习时代,这些计算机视觉任务是如何工作的,可使读者快速了解这些算法原理,以及其相互之间的关系。本书适合高年级本科生、研究生、教师,以及对人工智能或计算机视觉算法感兴趣的工程技术人员阅读。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 深度学习与计算机视觉基础
- 1.1 人工智能简介
- 1.2 深度学习的崛起以及存在的问题
- 1.3 神经网络的基本概念
- 1.3.1 前馈神经网络
- 1.3.2 反向传播算法
- 1.3.3 权重系数更新
- 1.4 卷积神经网络原理
- 1.4.1 CNN的起源与发展
- 1.4.2 CNN结构简介
- 1.4.3 CNN的其他组件
- 1.5 计算机视觉简介
- 参考文献
- 第2章 基于深度学习的图像分类算法
- 2.1 图像分类
- 2.2 卷积神经网络结构演化
- 2.2.1 从LeNet到VGG
- 2.2.2 Inception系列
- 2.2.3 ResNet系列
- 2.2.4 DenseNet系列
- 2.2.5 SqueezeNet系列
- 2.2.6 ShuffleNet系列
- 2.2.7 MobileNet系列
- 2.3 神经架构搜索
- 2.4 CNN的计算量与参数计算方法
- 2.5 小结
- 参考文献
- 第3章 基于深度学习的目标检测算法
- 3.1 目标检测
- 3.1.1 任务简介
- 3.1.2 传统的目标检测算法
- 3.1.3 基于深度学习的目标检测方法
- 3.2 目标检测的重要概念
- 3.2.1 交并比和非极大值抑制
- 3.2.2 难负样本挖掘
- 3.2.3 边框回归
- 3.2.4 检测任务中的数据增广
- 3.2.5 先验框/默认边框/锚框
- 3.2.6 锚框与真实边框的匹配策略
- 3.2.7 感受野
- 3.2.8 RoI特征图映射
- 3.3 双阶段检测算法
- 3.3.1 从R-CNN到Fast R-CNN
- 3.3.2 Faster R-CNN算法原理
- 3.4 单阶段检测算法
- 3.4.1 YOLO检测算法
- 3.4.2 SSD检测算法
- 3.5 融合单阶段和双阶段的算法
- 3.5.1 单阶段检测算法及双阶段检测算法的特点
- 3.5.2 RefineDet:结合单阶段及双阶段优点
- 3.6 从头训练的检测算法
- 3.6.1 从头训练的检测算法简介
- 3.6.2 精心设计CNN实现从头训练
- 3.6.3 从头训练的本质
- 3.7 检测任务中的级联设计
- 3.7.1 传统的级联检测算法
- 3.7.2 深度学习下的级联检测
- 3.8 多尺度目标检测
- 3.8.1 问题描述以及常用方法
- 3.8.2 多尺度训练/测试
- 3.8.3 特征金字塔融合多层特征
- 3.8.4 小尺寸目标检测
- 3.9 检测任务中的不平衡处理策略
- 3.9.1 双阶段中的不平衡策略
- 3.9.2 单阶段中的不平衡策略
- 3.10 锚框的轮回
- 3.10.1 锚框的起源
- 3.10.2 现有检测算法中锚框的设计方法
- 3.10.3 锚框存在的问题
- 3.10.4 不需要锚框的算法
- 3.11 目标检测的骨干网络设计
- 3.12 检测算法加速
- 3.12.1 检测流程的加速
- 3.12.2 检测算法的轻量级网络
- 3.13 自然场景文字检测
- 3.14 遥感图像目标检测
- 3.15 常用数据集和评价指标
- 参考文献
- 第4章 基于深度学习的图像语义分割算法
- 4.1 图像语义分割简介
- 4.2 语义分割研究难点
- 4.3 语义分割算法模型
- 4.3.1 全卷积网络基础算法:FCN算法
- 4.3.2 编码-解码结构算法:U-Net算法
- 4.3.3 空洞卷积的应用:DeepLab系列
- 4.4 图像实时语义分割
- 4.4.1 实时语义分割简介
- 4.4.2 ENet算法
- 4.5 图像分割数据集以及评价指标
- 4.5.1 图像分割数据集
- 4.5.2 语义分割评估指标
- 参考文献
- 第5章 基于深度学习的人体姿态估计算法
- 5.1 人体姿态估计任务简介
- 5.1.1 任务简介
- 5.1.2 面临的挑战
- 5.1.3 方法概述
- 5.2 单人姿态估计
- 5.3 自顶向下的多人姿态估计
- 5.4 自底向上的多人姿态估计
- 5.5 常用数据集以及评价指标
- 参考文献
- 第6章 基于深度学习的行人重识别与目标跟踪
- 6.1 行人重识别任务简介
- 6.1.1 任务简介
- 6.1.2 工作流程
- 6.1.3 面临的挑战
- 6.1.4 与行人跟踪和人脸验证的关系
- 6.1.5 行人重识别数据集及评价指标
- 6.2 特征提取和相似度度量
- 6.3 行人重识别:从全局特征到局部特征
- 6.4 行人重识别:从表征学习到度量学习
- 6.5 目标跟踪任务简介
- 6.6 基于相关滤波的目标跟踪算法
- 6.7 基于孪生网络的跟踪算法
- 参考文献
- 第7章 基于深度学习的人脸识别
- 7.1 任务简介
- 7.1.1 人脸验证和人脸识别的区别
- 7.1.2 图像分类和人脸识别的异同
- 7.1.3 技术难点
- 7.1.4 人脸识别算法原理
- 7.2 Softmax原理及存在的问题
- 7.2.1 Softmax函数和Softmax损失
- 7.2.2 Softmax存在的问题
- 7.3 度量损失
- 7.3.1 对比损失
- 7.3.2 三元组损失
- 7.4 大间隔损失
- 7.4.1 L-Softmax
- 7.4.2 SphereFace
- 7.4.3 CosFace
- 7.4.4 ArcFace
- 7.4.5 大间隔损失总结
- 7.5 特征规范化和权重规范化
- 参考文献
- 第8章 基于深度学习的图像超分辨率重建方法
- 8.1 任务简介
- 8.2 传统方法
- 8.2.1 基于插值的方法
- 8.2.2 基于重建的方法
- 8.2.3 基于学习的方法
- 8.3 基于卷积神经网络的图像超分辨率重建方法
- 8.3.1 网络模型
- 8.3.2 损失函数
- 8.3.3 训练样本
- 8.3.4 训练策略
- 8.4 常用数据集与评价指标
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。