科技
类型
可以朗读
语音朗读
239千字
字数
2023-09-01
发行日期
展开全部
主编推荐语
全面系统地阐述现代计算机视觉实用技术、方法和实践,涵盖50多个计算机视觉问题。
内容简介
全书分为四部分:第一部分(第1~3章)介绍神经网络和PyTorch的基础知识,以及如何使用PyTorch构建并训练神经网络,包括输入数据缩放、批归一化、超参数调整等;
第二部分(第4~10章)介绍如何使用卷积神经网络、迁移学习等技术解决更复杂的视觉相关问题,包括图像分类、目标检测和图像分割等;
第三部分(第11~13章)介绍各种图像处理技术,包括自编码器模型和各种类型的GAN模型;
第四部分(第14~18章)探讨将计算机视觉技术与NLP、强化学习和OpenCV等技术相结合来解决传统问题的新方法。
目录
- 版权信息
- 译者序
- 前言
- 第一部分 面向计算机视觉的深度学习基础知识
- 第1章 人工神经网络基础
- 1.1 比较人工智能与传统机器学习
- 1.2 人工神经网络的构建模块
- 1.3 实现前向传播
- 1.4 实现反向传播
- 1.5 整合前向传播与反向传播
- 1.6 理解学习率的影响
- 1.7 总结神经网络的训练过程
- 1.8 小结
- 1.9 课后习题
- 第2章 PyTorch基础
- 2.1 安装PyTorch
- 2.2 PyTorch张量
- 2.3 使用PyTorch构建神经网络
- 2.4 使用序贯方法构建神经网络
- 2.5 保存并加载PyTorch模型
- 2.6 小结
- 2.7 课后习题
- 第3章 使用PyTorch构建深度神经网络
- 3.1 表示图像
- 3.2 为什么要使用神经网络进行图像分析
- 3.3 为图像分类准备数据
- 3.4 训练神经网络
- 3.5 缩放数据集以提升模型准确度
- 3.6 理解不同批大小的影响
- 3.7 理解不同损失优化器的影响
- 3.8 理解不同学习率的影响
- 3.9 理解不同学习率衰减的影响
- 3.10 构建更深的神经网络
- 3.11 理解不同批归一化的影响
- 3.12 过拟合的概念
- 3.13 小结
- 3.14 课后习题
- 第二部分 物体分类与目标检测
- 第4章 卷积神经网络
- 4.1 传统深度神经网络的问题
- 4.2 CNN的构建模块
- 4.3 实现CNN
- 4.4 使用深度CNN分类图像
- 4.5 实现数据增强
- 4.6 特征学习结果的可视化
- 4.7 构建对真实图像进行分类的CNN
- 4.8 小结
- 4.9 课后习题
- 第5章 面向图像分类的迁移学习
- 5.1 迁移学习简介
- 5.2 理解VGG16架构
- 5.3 理解ResNet架构
- 5.4 实现人脸关键点检测
- 5.5 多任务学习——实现年龄估计和性别分类
- 5.6 torch_snippets库简介
- 5.7 小结
- 5.8 课后习题
- 第6章 图像分类的实战技术
- 6.1 生成CAM
- 6.2 数据增强和批归一化
- 6.3 模型实现的实践要点
- 6.4 小结
- 6.5 课后习题
- 第7章 目标检测基础
- 7.1 目标检测简介
- 7.2 为训练图像样本创建真值
- 7.3 理解区域建议
- 7.4 理解IoU
- 7.5 非极大抑制
- 7.6 mAP
- 7.7 训练基于R-CNN的定制目标检测器
- 7.8 训练基于Fast R-CNN的定制目标检测器
- 7.9 小结
- 7.10 课后习题
- 第8章 目标检测进阶
- 8.1 现代目标检测算法的组成
- 8.2 基于定制数据集训练Faster R-CNN
- 8.3 YOLO的工作细节
- 8.4 基于定制数据集训练YOLO
- 8.5 SSD模型的工作细节
- 8.6 基于定制数据集训练SSD模型
- 8.7 小结
- 8.8 课后习题
- 第9章 图像分割
- 9.1 探索U-Net架构
- 9.2 使用U-Net实现语义分割
- 9.3 探索Mask R-CNN架构
- 9.4 使用Mask R-CNN实现实例分割
- 9.5 小结
- 9.6 课后习题
- 第10章 目标检测与分割的应用
- 10.1 多目标实例分割
- 10.2 人体姿态检测
- 10.3 人群计数
- 10.4 图像着色
- 10.5 面向点云的三维目标检测
- 10.6 小结
- 第三部分 图像处理
- 第11章 自编码器与图像处理
- 11.1 理解自编码器
- 11.2 理解卷积自编码器
- 11.3 理解变分自编码器
- 11.4 图像对抗性攻击
- 11.5 图像风格迁移
- 11.6 生成深度虚拟图像
- 11.7 小结
- 11.8 课后习题
- 第12章 基于GAN的图像生成
- 12.1 GAN模型简介
- 12.2 使用GAN生成手写数字
- 12.3 使用DCGAN生成人脸图像
- 12.4 实现条件GAN模型
- 12.5 小结
- 12.6 课后习题
- 第13章 高级GAN图像处理
- 13.1 使用Pix2Pix GAN模型
- 13.2 使用CycleGAN模型
- 13.3 在定制图像上使用StyleGAN模型
- 13.4 超分辨率GAN
- 13.5 小结
- 13.6 课后习题
- 第四部分 计算机视觉与其他技术
- 第14章 使用小样本进行模型训练
- 14.1 实现零样本学习
- 14.2 实现小样本学习
- 14.3 小结
- 14.4 课后习题
- 第15章 计算机视觉与NLP
- 15.1 RNN模型简介
- 15.2 LSTM架构简介
- 15.3 生成图像标题
- 15.4 转录手写图像
- 15.5 使用DETR进行目标检测
- 15.6 小结
- 15.7 课后习题
- 第16章 计算机视觉与强化学习
- 16.1 强化学习基础知识
- 16.2 实现Q学习
- 16.3 实现深度Q学习
- 16.4 目标固定的深度Q学习
- 16.5 实现自动驾驶智能体
- 16.6 小结
- 16.7 课后习题
- 第17章 模型的实际应用部署
- 17.1 API基础知识
- 17.2 在本地服务器上创建API并进行预测
- 17.3 将API部署到云端
- 17.4 小结
- 第18章 使用OpenCV实用程序进行图像分析
- 18.1 图像中的单词检测
- 18.2 图像中的车道线检测
- 18.3 基于颜色的目标检测
- 18.4 构建全景图像
- 18.5 图像中的车牌检测
- 18.6 小结
- 附录 课后习题答案
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。