计算机
类型
可以朗读
语音朗读
120千字
字数
2023-08-01
发行日期
展开全部
主编推荐语
本书带你层层揭深度学习用于目标检测的“神秘面纱”,探究其中的奥秘。
内容简介
本书遵循循序渐进、深入浅出的理念,引领读者夯实相关基础知识,掌握传统目标检测方法,再逐步过渡到深度学习的基本概念及分类用法,进而深入讲解目标检测的两阶段深度学习方法、一阶段学习方法,即从以R-CNN为代表的两阶段深度学习方法、以YOLO系列为代表的一阶段学习方法等,层层揭开深度学习用于目标检测的“神秘面纱”,探究其中的奥秘。
目录
- 版权信息
- 内容简介
- 前言
- 第1章 计算机视觉及目标检测
- 1.1 计算机视觉原理
- 1.1.1 人类视觉与计算机视觉比较
- 1.1.2 计算机视觉应用展现
- 1.2 目标检测概述
- 1.2.1 计算机视觉三大主要任务
- 1.2.2 目标检测的应用
- 1.2.3 目标检测面临的挑战
- 1.2.4 目标检测方法
- 第2章 计算机视觉数学、编程基础
- 2.1 向量、矩阵和卷积
- 2.1.1 向量
- 2.1.2 矩阵
- 2.1.3 卷积
- 2.2 函数极值理论与非极大值抑制
- 2.2.1 函数极值理论
- 2.2.2 非极大值抑制
- 2.3 跨平台计算机视觉和机器学习软件库OpenCV基础
- 2.3.1 OpenCV的历史起源
- 2.3.2 安装OpenCV
- 2.3.3 OpenCV图像和视频的读/写
- 2.3.4 OpenCV基本操作
- 2.3.5 OpenCV颜色空间转换
- 2.3.6 OpenCV几何变换
- 2.3.7 OpenCV图像简单阈值处理
- 2.3.8 OpenCV形态学转换
- 2.3.9 OpenCV图像梯度
- 2.4 PyTorch基础
- 2.4.1 PyTorch简介
- 2.4.2 PyTorch安装
- 2.4.3 张量
- 2.4.4 基本代码操作
- 2.4.5 PIL图像格式转换
- 2.4.6 PyTorch自动求导机制
- 2.4.7 PyTorch的神经网络nn包
- 第3章 OpenCV目标检测实战
- 3.1 Haar特征与积分图像构建算法
- 3.1.1 Haar特征
- 3.1.2 积分图像构建算法
- 3.2 AdaBoost应用于Haar人脸特征分类
- 3.3 AdaBoost级联应用于Haar特征人脸检测
- 3.4 利用OpenCV进行基于Haar特征的人脸检测实战
- 第4章 深度学习引入及图像分类实战
- 4.1 卷积神经网络的重要概念
- 4.2 卷积神经网络训练技巧及经典架构
- 4.3 设计卷积神经网络进行图像分类
- 4.4 选择卷积神经网络损失函数及优化器
- 4.5 改进卷积神经网络以提高图像分类准确率
- 第5章 目标检测的两阶段深度学习方法
- 5.1 R-CNN目标检测思想
- 5.1.1 目标检测数据集
- 5.1.2 从滑动窗口到选择搜索
- 5.1.3 R-CNN网络架构及训练过程
- 5.2 目标检测指标
- 5.3 R-CNN目标检测模型评估结果
- 5.3.1 R-CNN用于细粒度类别检测
- 5.3.2 R-CNN用于目标检测与分割
- 5.4 R-CNN的缺陷和Fast R-CNN的改进
- 5.4.1 R-CNN的缺陷
- 5.4.2 感兴趣区域池化
- 5.4.3 Fast R-CNN创新损失函数设计
- 5.5 Fast R-CNN网络架构和模型评估
- 5.5.1 Fast R-CNN模型工作流程
- 5.5.2 Fast R-CNN网络架构
- 5.5.3 RoI池化反向传播方法
- 5.5.4 Fast R-CNN结果评估
- 5.6 Fast R-CNN的创新
- 5.6.1 Faster R-CNN的创新思想
- 5.6.2 替代选择搜索的锚框
- 5.6.3 区域建议网络
- 5.7 深入剖析Faster R-CNN中边界框回归
- 5.7.1 为什么使用边界框回归
- 5.7.2 边界框回归的数学支撑
- 5.8 Faster R-CNN的全景架构和损失函数
- 5.9 Faster R-CNN的训练步骤及测试步骤
- 5.9.1 Faster R-CNN的训练步骤
- 5.9.2 Faster R-CNN的测试步骤
- 5.10 详细讲解Faster R-CNN关键部分RoI代码
- 第6章 目标检测的一阶段学习方法
- 6.1 YOLO目标检测思想
- 6.1.1 改进思想
- 6.1.2 网格单元
- 6.1.3 YOLO创新细节
- 6.2 YOLO的网络结构、网络与损失函数
- 6.2.1 YOLO的网络结构
- 6.2.2 YOLO的网络训练与损失函数
- 6.3 YOLO模型评估、优劣势分析
- 6.3.1 YOLO数据集
- 6.3.2 YOLO模型评估
- 6.3.3 YOLO模型优缺点
- 6.4 YOLOv2实现更好、更快、更强
- 6.5 YOLOv2改进YOLOv1
- 6.5.1 批归一化
- 6.5.2 高分辨率分类器
- 6.5.3 预设锚框并采用全卷积
- 6.5.4 框聚类
- 6.5.5 约束边框位置
- 6.5.6 细粒度特征
- 6.5.7 多尺度训练
- 6.5.8 实验对比
- 6.6 YOLOv2 使用Darknet-19
- 6.6.1 Darknet-19
- 6.6.2 三阶段训练
- 6.6.3 YOLOv2的损失函数
- 6.7 使用WordTree的YOLO9000
- 6.7.1 组合两种数据集的必要性
- 6.7.2 构建WordTree进行分层分类
- 6.7.3 在组合数据集上训练YOLO9000
- 第7章 YOLOv3创新思想及整体架构
- 7.1 YOLOv3的创新改进
- 7.2 YOLOv3的关键创新点
- 7.2.1 106层的Darknet-53主干网络架构
- 7.2.2 三级检测
- 7.2.3 更擅长检测较小的物体
- 7.2.4 更多的锚框
- 7.2.5 损失函数
- 7.3 YOLOv3的三级检测输出过程
- 7.4 YOLOv3的非极大值抑制
- 7.5 YOLOv3的检测效果
- 7.6 SSD多尺度特征图目标检测思想
- 7.7 SSD网络架构
- 7.7.1 SSD网络基础架构
- 7.7.2 扩张卷积
- 7.7.3 SSD与YOLOv3
- 7.7.4 SSD网络检测物体方法
- 7.8 SSD网络损失函数
- 7.8.1 默认框匹配策略
- 7.8.2 损失函数
- 7.9 SSD较YOLOv3的劣势
- 第8章 构建Darknet-53网络实践
- 8.1 Darknet-53网络工程结构和配置
- 8.2 实践代码
- 8.3 构建Darknet-53网络前向传递过程
- 8.3.1 构建Darknet-53的模块
- 8.3.2 Darknet-53的模块详解
- 8.4 YOLOv3 实现检测层特征图到边界的预测值转变
- 8.4.1 参数讲解
- 8.4.2 实现步骤和代码
- 8.5 YOLOv3 演示边框生成过程
- 8.6 YOLOv3 处理低阈值边框
- 8.6.1 思路讲解
- 8.6.2 代码实践
- 8.7 YOLOv3 非极大值抑制过程
- 8.7.1 延续上一节代码讲解NMS过程
- 8.7.2 NMS后的整理
- 8.8 YOLOv3演示NMS过程找到最优框
- 8.8.1 运行检测代码演示
- 8.8.2 运行结果分析
- 8.9 YOLOv3实现工业工具检测
- 8.9.1 YOLOv3工业实践需求分析及目标分析
- 8.9.2 数据采集标注与数据预处理部分
- 8.9.3 模型训练部分
- 8.9.4 模型优化部分
- 第9章 YOLOv4目标检测方法
- 9.1 YOLOv4目标检测创新路径及技巧体系
- 9.1.1 速度与精度双提升
- 9.1.2 YOLOv4技巧汇总
- 9.2 YOLOv4大型网络架构及其主要创新改进
- 9.2.1 空间金字塔结构
- 9.2.2 路径增强网络
- 9.2.3 使用YOLOv4的网络详情
- 9.2.4 CSPDarknet-53网络
- 9.2.5 YOLOv4网络全景关系
- 9.3 YOLOv4中的激活函数
- 9.3.1 各激活函数的比较
- 9.3.2 keras实现三种激活函数性能比较
- 9.4 YOLOv4中的损失函数C-IoU
- 9.4.1 L1和L2损失的缺陷
- 9.4.2 IoU和IoU损失
- 9.4.3 G-IoU、D-IoU和C-IoU
- 9.5 YOLOv4中的新型批标准化
- 9.5.1 各种批标准化
- 9.5.2 跨迭代标准化
- 第10章 EfficientDet目标检测方法
- 10.1 复合缩放
- 10.2 双向特征金字塔网络
- 10.3 EfficientDet体系结构
- 10.3.1 输入图像分辨率缩放
- 10.3.2 BiFPN缩放
- 10.3.3 框/类预测网络缩放
- 10.3.4 主干网
- 10.4 EfficientDet推理效果和不足之处
- 10.4.1 EfficientDet推理效果
- 10.4.2 EfficientDet不足之处
- 参考文献
- 反侵权盗版声明
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。