计算机
类型
可以朗读
语音朗读
241千字
字数
2021-08-01
发行日期
展开全部
主编推荐语
一本书入门计算机视觉,将深度学习理论融入视觉识别案例,搭建理论与实践的桥梁。
内容简介
本书立足实践,从机器学习的基础技能出发,深入浅出地介绍了如何使用Python进行基于深度学习的计算机视觉项目开发。
开篇介绍了基于传统机器学习及图像处理方法的计算机视觉技术;然后重点就图像分类、目标检测、图像分割、图像搜索、图像压缩及文本识别等常见的计算机视觉项目做了理论结合实践的讲解;最后探索了深度学习项目落地时会用到的量化、剪枝等技术,并提供了模型服务端部署案例。
本书适合有一定的Python编程基础,初学深度学习的读者阅读。
目录
- 版权信息
- 前言
- 第1章 机器学习与sklearn
- 1.1 sklearn环境配置
- 1.1.1 环境要求
- 1.1.2 安装方法
- 1.1.3 修改pip源
- 1.1.4 安装Jupyter Notebook
- 1.2 数据集
- 1.2.1 自带的小型数据集
- 1.2.2 在线下载的数据集
- 1.2.3 计算机生成的数据集
- 1.3 分类
- 1.3.1 加载数据与模型
- 1.3.2 建立分类模型
- 1.3.3 模型的训练及预测
- 1.3.4 模型评价
- 1.4 回归
- 1.4.1 线性回归
- 1.4.2 回归模型评价
- 1.5 聚类
- 1.5.1 K-means
- 1.5.2 DBSCAN
- 1.5.3 聚类实例
- 1.6 降维
- 1.6.1 PCA降维
- 1.6.2 LDA降维
- 1.7 模型验证
- 1.8 模型持久化
- 1.8.1 joblib
- 1.8.2 pickle
- 1.9 小结
- 第2章 传统图像处理方法
- 2.1 图像分类
- 2.1.1 HOG的原理
- 2.1.2 工具介绍
- 2.1.3 CIFAR-10分类
- 2.1.4 手写字符分类
- 2.2 目标检测
- 2.3 图像分割
- 2.4 图像搜索
- 2.5 小结
- 第3章 深度学习与PyTorch
- 3.1 框架介绍
- 3.2 环境配置
- 3.3 运算基本单元
- 3.3.1 Tensor数据类型
- 3.3.2 Tensor与ndarray
- 3.3.3 CPU与GPU运算
- 3.3.4 PyTorch实现K-means
- 3.4 自动求导
- 3.5 数据加载
- 3.5.1 Dataset
- 3.5.2 DataLoader
- 3.6 神经网络工具包
- 3.6.1 Module模块
- 3.6.2 线性层
- 3.6.3 卷积层
- 3.6.4 池化层
- 3.6.5 BatchNorm层
- 3.6.6 激活层
- 3.6.7 神经网络各层输出的可视化
- 3.6.8 循环神经网络
- 3.6.9 Sequential和ModuleList
- 3.6.10 损失函数
- 3.7 模型优化器optim
- 3.7.1 optim用法
- 3.7.2 优化器的选择
- 3.7.3 学习率的选择
- 3.8 参数初始化init
- 3.9 模型持久化
- 3.10 JIT编译器
- 3.11 模型迁移ONNX
- 3.12 数据可视化TensorBoard
- 3.13 机器视觉工具包torchvision
- 3.13.1 数据
- 3.13.2 模型
- 3.13.3 图像处理
- 3.14 小结
- 第4章 卷积神经网络中的分类与回归
- 4.1 卷积神经网络中的分类问题
- 4.1.1 CIFAR-10图像分类
- 4.1.2 卷积神经网络的发展
- 4.1.3 分类网络的实现
- 4.1.4 模型训练
- 4.1.5 模型展示
- 4.1.6 多标签分类
- 4.2 卷积神经网络中的回归问题
- 4.2.1 生成数据集
- 4.2.2 模型训练
- 4.2.3 模型展示
- 4.3 小结
- 第5章 目标检测
- 5.1 深度学习物体检测算法
- 5.1.1 两段式检测
- 5.1.2 一段式检测
- 5.2 数据集构建
- 5.2.1 选择目标物体图片
- 5.2.2 背景图片下载
- 5.2.3 图片合成
- 5.3 数据加载
- 5.4 数据标记与损失函数构建
- 5.4.1 数据标记
- 5.4.2 损失函数
- 5.5 模型搭建与训练
- 5.6 模型预测
- 5.7 小结
- 第6章 图像分割
- 6.1 数据加载
- 6.2 模型搭建
- 6.3 模型训练
- 6.4 模型展示
- 6.5 智能弹幕
- 6.6 像素级回归问题:超分辨率重建
- 6.6.1 超分辨率重建算法的发展
- 6.6.2 数据加载
- 6.6.3 模型搭建与训练
- 6.6.4 模型展示
- 6.7 小结
- 第7章 图像搜索
- 7.1 分类网络的特征
- 7.2 深度学习人脸识别技术
- 7.2.1 FaceNet
- 7.2.2 CosFace和ArcFace
- 7.3 数据处理
- 7.3.1 数据下载
- 7.3.2 数据检查
- 7.3.3 数据提取
- 7.4 模型训练
- 7.4.1 普通分类模型
- 7.4.2 CosFace
- 7.5 图像搜索
- 7.5.1 图像比对
- 7.5.2 KD-Tree搜索
- 7.6 小结
- 第8章 图像压缩
- 8.1 AutoEncoder
- 8.1.1 AutoEncoder的原理
- 8.1.2 AutoEncoder模型搭建
- 8.1.3 数据加载
- 8.1.4 模型训练
- 8.1.5 结果展示
- 8.2 GAN
- 8.2.1 GAN原理
- 8.2.2 GAN训练流程
- 8.2.3 GAN随机生成人脸图片
- 8.2.4 GAN与AutoEncoder的结合
- 8.2.5 图像修复
- 8.3 小结
- 第9章 不定长文本识别
- 9.1 循环神经网络概述
- 9.2 时间序列预测
- 9.2.1 创建模型
- 9.2.2 生成数据
- 9.2.3 模型训练
- 9.2.4 模型预测
- 9.3 CRNN模型
- 9.3.1 CRNN算法简介
- 9.3.2 CTCLoss函数
- 9.3.3 模型结构
- 9.3.4 数据预处理
- 9.3.5 模型训练
- 9.3.6 模型预测
- 9.4 小结
- 第10章 神经网络压缩与部署
- 10.1 剪枝
- 10.1.1 模型设计
- 10.1.2 训练基础模型
- 10.1.3 模型稀疏化
- 10.1.4 压缩模型通道
- 10.2 量化
- 10.3 混合精度训练
- 10.4 深度学习模型的服务端部署
- 10.4.1 创建接口
- 10.4.2 访问接口
- 10.5 小结
- 作者简介
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。