展开全部

主编推荐语

全面系统地阐述现代计算机视觉实用技术、方法和实践,涵盖50多个计算机视觉问题。

内容简介

全书分为四部分:第一部分(第1~3章)介绍神经网络和PyTorch的基础知识,以及如何使用PyTorch构建并训练神经网络,包括输入数据缩放、批归一化、超参数调整等;

第二部分(第4~10章)介绍如何使用卷积神经网络、迁移学习等技术解决更复杂的视觉相关问题,包括图像分类、目标检测和图像分割等;

第三部分(第11~13章)介绍各种图像处理技术,包括自编码器模型和各种类型的GAN模型;

第四部分(第14~18章)探讨将计算机视觉技术与NLP、强化学习和OpenCV等技术相结合来解决传统问题的新方法。

目录

  • 版权信息
  • 译者序
  • 前言
  • 第一部分 面向计算机视觉的深度学习基础知识
  • 第1章 人工神经网络基础
  • 1.1 比较人工智能与传统机器学习
  • 1.2 人工神经网络的构建模块
  • 1.3 实现前向传播
  • 1.4 实现反向传播
  • 1.5 整合前向传播与反向传播
  • 1.6 理解学习率的影响
  • 1.7 总结神经网络的训练过程
  • 1.8 小结
  • 1.9 课后习题
  • 第2章 PyTorch基础
  • 2.1 安装PyTorch
  • 2.2 PyTorch张量
  • 2.3 使用PyTorch构建神经网络
  • 2.4 使用序贯方法构建神经网络
  • 2.5 保存并加载PyTorch模型
  • 2.6 小结
  • 2.7 课后习题
  • 第3章 使用PyTorch构建深度神经网络
  • 3.1 表示图像
  • 3.2 为什么要使用神经网络进行图像分析
  • 3.3 为图像分类准备数据
  • 3.4 训练神经网络
  • 3.5 缩放数据集以提升模型准确度
  • 3.6 理解不同批大小的影响
  • 3.7 理解不同损失优化器的影响
  • 3.8 理解不同学习率的影响
  • 3.9 理解不同学习率衰减的影响
  • 3.10 构建更深的神经网络
  • 3.11 理解不同批归一化的影响
  • 3.12 过拟合的概念
  • 3.13 小结
  • 3.14 课后习题
  • 第二部分 物体分类与目标检测
  • 第4章 卷积神经网络
  • 4.1 传统深度神经网络的问题
  • 4.2 CNN的构建模块
  • 4.3 实现CNN
  • 4.4 使用深度CNN分类图像
  • 4.5 实现数据增强
  • 4.6 特征学习结果的可视化
  • 4.7 构建对真实图像进行分类的CNN
  • 4.8 小结
  • 4.9 课后习题
  • 第5章 面向图像分类的迁移学习
  • 5.1 迁移学习简介
  • 5.2 理解VGG16架构
  • 5.3 理解ResNet架构
  • 5.4 实现人脸关键点检测
  • 5.5 多任务学习——实现年龄估计和性别分类
  • 5.6 torch_snippets库简介
  • 5.7 小结
  • 5.8 课后习题
  • 第6章 图像分类的实战技术
  • 6.1 生成CAM
  • 6.2 数据增强和批归一化
  • 6.3 模型实现的实践要点
  • 6.4 小结
  • 6.5 课后习题
  • 第7章 目标检测基础
  • 7.1 目标检测简介
  • 7.2 为训练图像样本创建真值
  • 7.3 理解区域建议
  • 7.4 理解IoU
  • 7.5 非极大抑制
  • 7.6 mAP
  • 7.7 训练基于R-CNN的定制目标检测器
  • 7.8 训练基于Fast R-CNN的定制目标检测器
  • 7.9 小结
  • 7.10 课后习题
  • 第8章 目标检测进阶
  • 8.1 现代目标检测算法的组成
  • 8.2 基于定制数据集训练Faster R-CNN
  • 8.3 YOLO的工作细节
  • 8.4 基于定制数据集训练YOLO
  • 8.5 SSD模型的工作细节
  • 8.6 基于定制数据集训练SSD模型
  • 8.7 小结
  • 8.8 课后习题
  • 第9章 图像分割
  • 9.1 探索U-Net架构
  • 9.2 使用U-Net实现语义分割
  • 9.3 探索Mask R-CNN架构
  • 9.4 使用Mask R-CNN实现实例分割
  • 9.5 小结
  • 9.6 课后习题
  • 第10章 目标检测与分割的应用
  • 10.1 多目标实例分割
  • 10.2 人体姿态检测
  • 10.3 人群计数
  • 10.4 图像着色
  • 10.5 面向点云的三维目标检测
  • 10.6 小结
  • 第三部分 图像处理
  • 第11章 自编码器与图像处理
  • 11.1 理解自编码器
  • 11.2 理解卷积自编码器
  • 11.3 理解变分自编码器
  • 11.4 图像对抗性攻击
  • 11.5 图像风格迁移
  • 11.6 生成深度虚拟图像
  • 11.7 小结
  • 11.8 课后习题
  • 第12章 基于GAN的图像生成
  • 12.1 GAN模型简介
  • 12.2 使用GAN生成手写数字
  • 12.3 使用DCGAN生成人脸图像
  • 12.4 实现条件GAN模型
  • 12.5 小结
  • 12.6 课后习题
  • 第13章 高级GAN图像处理
  • 13.1 使用Pix2Pix GAN模型
  • 13.2 使用CycleGAN模型
  • 13.3 在定制图像上使用StyleGAN模型
  • 13.4 超分辨率GAN
  • 13.5 小结
  • 13.6 课后习题
  • 第四部分 计算机视觉与其他技术
  • 第14章 使用小样本进行模型训练
  • 14.1 实现零样本学习
  • 14.2 实现小样本学习
  • 14.3 小结
  • 14.4 课后习题
  • 第15章 计算机视觉与NLP
  • 15.1 RNN模型简介
  • 15.2 LSTM架构简介
  • 15.3 生成图像标题
  • 15.4 转录手写图像
  • 15.5 使用DETR进行目标检测
  • 15.6 小结
  • 15.7 课后习题
  • 第16章 计算机视觉与强化学习
  • 16.1 强化学习基础知识
  • 16.2 实现Q学习
  • 16.3 实现深度Q学习
  • 16.4 目标固定的深度Q学习
  • 16.5 实现自动驾驶智能体
  • 16.6 小结
  • 16.7 课后习题
  • 第17章 模型的实际应用部署
  • 17.1 API基础知识
  • 17.2 在本地服务器上创建API并进行预测
  • 17.3 将API部署到云端
  • 17.4 小结
  • 第18章 使用OpenCV实用程序进行图像分析
  • 18.1 图像中的单词检测
  • 18.2 图像中的车道线检测
  • 18.3 基于颜色的目标检测
  • 18.4 构建全景图像
  • 18.5 图像中的车牌检测
  • 18.6 小结
  • 附录 课后习题答案
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。