科技
类型
可以朗读
语音朗读
453千字
字数
2021-09-01
发行日期
展开全部
主编推荐语
本书根据当前人工智能RNN深度学习的发展成果,具体设计基于RNN的模型算法,并给出了具体实现,算法流程及Python代码实现。
内容简介
全书主要内容包括:基于深度学习的图像处理的20个案例,基于Python的具体实现,本书图文并茂,丰富实用,深入浅出,易学易用。
目录
- 版权信息
- 作者简介
- 内容简介
- 前言 PREFACE
- 项目1 PROJECT 1 基于插帧和超分辨率的视频增强应用
- 1.1 总体设计
- 1.1.1 系统整体结构
- 1.1.2 系统流程
- 1.2 运行环境
- 1.2.1 Python环境
- 1.2.2 PyTorch环境
- 1.2.3 FFmpeg使用
- 1.2.4 百度AI Studio使用
- 1.3 模块实现
- 1.3.1 视频处理模块
- 1.3.2 超分辨率模块
- 1.3.3 插帧模块
- 1.3.4 GUI模块
- 1.4 系统测试
- 1.4.1 算法训练
- 1.4.2 GUI界面效果
- 1.4.3 输出效果展示
- 项目2 PROJECT 2 基于Pix2Pix的快速图像风格迁移
- 2.1 总体设计
- 2.1.1 系统整体结构
- 2.1.2 系统流程
- 2.2 运行环境
- 2.2.1 Python环境
- 2.2.2 TensorFlow环境
- 2.2.3 Flask环境
- 2.2.4 微信小程序环境
- 2.3 模块实现
- 2.3.1 数据预处理
- 2.3.2 创建模型与编译
- 2.3.3 模型训练及保存
- 2.3.4 构建Pix2Pix数据集
- 2.3.5 Pix2Pix模型构建
- 2.3.6 Pix2Pix模型训练及保存
- 2.3.7 后端搭建
- 2.4 系统测试
- 2.4.1 训练效果
- 2.4.2 测试效果
- 2.4.3 模型应用
- 项目3 PROJECT 3 常见花卉识别
- 3.1 总体设计
- 3.1.1 系统整体结构
- 3.1.2 系统流程
- 3.2 运行环境
- 3.2.1 Python环境
- 3.2.2 TensorFlow环境
- 3.2.3 Android环境
- 3.3 模块实现
- 3.3.1 数据预处理
- 3.3.2 创建模型并编译
- 3.3.3 模型训练及保存
- 3.3.4 模型生成
- 3.4 系统测试
- 3.4.1 训练准确率
- 3.4.2 测试效果
- 3.4.3 模型应用
- 项目4 PROJECT 4 基于Keras的狗狗分类与人脸相似检测器
- 4.1 总体设计
- 4.1.1 系统整体结构
- 4.1.2 系统流程
- 4.2 运行环境
- 4.2.1 Python环境
- 4.2.2 TensorFlow环境
- 4.2.3 Keras环境
- 4.2.4 安装库
- 4.3 模块实现
- 4.3.1 数据预处理
- 4.3.2 模型编译主体
- 4.3.3 图像检测
- 4.3.4 文本数据翻译与爬虫
- 4.3.5 模型训练评估与生成
- 4.3.6 前端界面
- 4.4 系统测试
- 4.4.1 前端界面展示
- 4.4.2 程序功能介绍
- 4.4.3 识别狗狗效果展示
- 4.4.4 识别人脸效果展示
- 项目5 PROJECT 5 猫猫相机
- 5.1 总体设计
- 5.1.1 系统整体结构
- 5.1.2 系统流程
- 5.2 运行环境
- 5.2.1 Python环境
- 5.2.2 mxnet环境
- 5.2.3 OpenCV环境
- 5.3 模块实现
- 5.3.1 数据预处理
- 5.3.2 创建模型并编译
- 5.3.3 模型训练及保存
- 5.3.4 模型测试
- 5.4 系统测试
- 5.4.1 训练准确率
- 5.4.2 测试效果
- 5.4.3 模型应用
- 项目6 PROJECT 6 基于Mask R-CNN的动物识别分割及渲染
- 6.1 总体设计
- 6.1.1 系统整体结构
- 6.1.2 系统流程
- 6.2 运行环境
- 6.2.1 Python环境
- 6.2.2 TensorFlow-GPU环境
- 6.2.3 Keras环境
- 6.2.4 pycocotools2.0环境
- 6.2.5 其他依赖库
- 6.3 模块实现
- 6.3.1 数据预处理
- 6.3.2 数据集处理
- 6.3.3 模型训练及保存
- 6.3.4 渲染效果实现
- 6.3.5 GUI设计
- 6.4 系统测试
- 6.4.1 模型评估
- 6.4.2 测试效果
- 6.4.3 模型应用
- 项目7 PROJECT 7 新冠肺炎辅助诊断系统
- 7.1 总体设计
- 7.1.1 系统整体结构
- 7.1.2 系统流程
- 7.2 运行环境
- 7.2.1 Python环境
- 7.2.2 PaddlePaddle环境
- 7.2.3 在线运行
- 7.3 模块实现
- 7.3.1 定义待测数据
- 7.3.2 加载预训练模型
- 7.3.3 数据预处理
- 7.3.4 可视化操作
- 7.4 系统测试
- 7.4.1 DICOM图像
- 7.4.2 预处理后的图像
- 7.4.3 肺部分割
- 7.4.4 病灶分割
- 7.4.5 分割结果
- 7.4.6 统计输出结果
- 项目8 PROJECT 8 Stroke-Controllable快速风格迁移在网页端应用
- 8.1 总体设计
- 8.1.1 系统整体结构
- 8.1.2 系统流程
- 8.2 运行环境
- 8.2.1 Python环境
- 8.2.2 TensorFlow环境
- 8.2.3 Linux环境
- 8.2.4 网页配置环境
- 8.3 模块实现
- 8.3.1 数据预处理
- 8.3.2 模型构建
- 8.3.3 模型训练及保存
- 8.3.4 模型测试
- 8.4 系统测试
- 8.4.1 训练准确率
- 8.4.2 测试效果
- 8.4.3 模型应用
- 项目9 PROJECT 9 SRGAN网络在网站默认头像生成中的应用
- 9.1 总体设计
- 9.1.1 系统整体结构
- 9.1.2 系统流程
- 9.2 运行环境
- 9.2.1 TensorFlow环境
- 9.2.2 网页服务器开发环境
- 9.3 模块实现
- 9.3.1 数据预处理
- 9.3.2 模型构建
- 9.3.3 模型训练及保存
- 9.3.4 网站搭建
- 9.4 系统测试
- 项目10 PROJECT 10 乱序成语验证码识别
- 10.1 总体设计
- 10.1.1 系统整体结构
- 10.1.2 系统流程
- 10.2 运行环境
- 10.2.1 Python环境
- 10.2.2 TensorFlow环境
- 10.2.3 安装所需的包
- 10.3 模块实现
- 10.3.1 数据预处理
- 10.3.2 模型一的构建和训练
- 10.3.3 模型二的构建和训练
- 10.3.4 乱序成语验证码识别
- 10.3.5 可视化界面的实现
- 10.4 系统测试
- 10.4.1 训练准确率
- 10.4.2 测试效果
- 10.4.3 可视化界面应用
- 项目11 PROJECT 11 基于CNN的SNEAKERS识别
- 11.1 总体设计
- 11.1.1 系统整体结构
- 11.1.2 系统流程
- 11.2 运行环境
- 11.2.1 Python环境与Flask框架
- 11.2.2 环境配置与工具包
- 11.2.3 微信小程序环境
- 11.3 模块实现
- 11.3.1 数据制作
- 11.3.2 数据构建
- 11.3.3 模型训练及保存
- 11.3.4 模型测试
- 11.3.5 前端与后台搭建
- 11.4 系统测试
- 11.4.1 训练准确率
- 11.4.2 测试效果
- 11.4.3 模型应用
- 项目12 PROJECT 12 基于SRGAN的单图像超分辨率
- 12.1 总体设计
- 12.1.1 系统整体结构
- 12.1.2 系统流程
- 12.2 运行环境
- 12.2.1 Python环境
- 12.2.2 PyTorch环境
- 12.2.3 网页端Flask框架
- 12.2.4 PyQt环境配置
- 12.3 模块实现
- 12.3.1 数据预处理
- 12.3.2 数据导入
- 12.3.3 定义模型
- 12.3.4 定义损失函数
- 12.3.5 模型训练及保存
- 12.3.6 服务器端架构
- 12.3.7 本地单机程序
- 12.4 系统测试
- 项目13 PROJECT 13 滤镜复制
- 13.1 总体设计
- 13.1.1 系统整体结构
- 13.1.2 系统流程
- 13.2 运行环境
- 13.2.1 Anaconda环境
- 13.2.2 TensorFlow环境
- 13.2.3 Keras环境
- 13.3 模块实现
- 13.3.1 模式选择
- 13.3.2 任意风格模式
- 13.3.3 固定风格模式
- 13.4 系统测试
- 13.4.1 任意风格模式测试结果
- 13.4.2 固定风格模式测试结果
- 项目14 PROJECT 14 基于PyTorch的快速风格迁移
- 14.1 总体设计
- 14.1.1 系统整体结构
- 14.1.2 系统流程
- 14.2 运行环境
- 14.2.1 Python环境
- 14.2.2 PyTorch环境
- 14.2.3 PyQt5环境
- 14.3 模块实现
- 14.3.1 数据预处理
- 14.3.2 模型构建
- 14.3.3 模型训练及保存
- 14.3.4 界面化及应用
- 14.4 系统测试
- 14.4.1 训练准确率
- 14.4.2 测试效果
- 14.4.3 程序应用
- 项目15 PROJECT 15 CASIA-HWDB手写汉字识别
- 15.1 总体设计
- 15.1.1 系统整体结构
- 15.1.2 系统流程
- 15.2 运行环境
- 15.2.1 Python环境
- 15.2.2 TensorFlow环境
- 15.2.3 wxPython和OpenCV环境
- 15.2.4 pyttsx3环境
- 15.3 模块实现
- 15.3.1 数据预处理
- 15.3.2 模型构建
- 15.3.3 模型训练及保存
- 15.3.4 前端界面
- 15.4 系统测试
- 15.4.1 测试效果
- 15.4.2 模型应用
- 项目16 PROJECT 16 图像智能修复
- 16.1 总体设计
- 16.1.1 系统整体结构
- 16.1.2 系统流程
- 16.2 运行环境
- 16.2.1 Python环境
- 16.2.2 TensorFlow环境
- 16.2.3 OpenFace环境
- 16.3 模块实现
- 16.3.1 数据预处理
- 16.3.2 模型构建
- 16.3.3 模型训练
- 16.3.4 程序实现
- 16.3.5 GUI设计
- 16.3.6 程序打包
- 16.4 系统测试
- 16.4.1 GAN网络损失变化
- 16.4.2 测试效果
- 项目17 PROJECT 17 黑白图像自动着色
- 17.1 总体设计
- 17.1.1 系统整体结构
- 17.1.2 系统流程
- 17.2 运行环境
- 17.3 模块实现
- 17.3.1 数据预处理
- 17.3.2 模型构建与训练
- 17.3.3 模型调用与结果优化
- 17.3.4 结果展示
- 17.4 系统测试
- 项目18 PROJECT 18 深度神经网络压缩与加速技术在风格迁移中的应用
- 18.1 总体设计
- 18.1.1 系统整体结构
- 18.1.2 系统流程
- 18.2 运行环境
- 18.2.1 Python环境
- 18.2.2 GPU环境
- 18.3 模块实现
- 18.3.1 数据预处理
- 18.3.2 创建模型
- 18.3.3 模型训练及保存
- 18.3.4 模型测试
- 18.4 系统测试
- 18.4.1 风格迁移效果
- 18.4.2 网络的加速与压缩
- 项目19 PROJECT 19 迁移学习的狗狗分类器
- 19.1 总体设计
- 19.1.1 系统整体结构
- 19.1.2 系统流程
- 19.2 运行环境
- 19.2.1 Python环境
- 19.2.2 TensorFlow环境
- 19.2.3 Keras环境
- 19.2.4 wxPython的安装
- 19.3 模块实现
- 19.3.1 数据预处理
- 19.3.2 模型构建
- 19.3.3 模型训练
- 19.3.4 API调用
- 19.3.5 模型生成
- 19.4 系统测试
- 19.4.1 训练准确率
- 19.4.2 测试效果
- 19.4.3 模型应用
- 项目20 PROJECT 20 基于TensorFlow的人脸检测及追踪
- 20.1 总体设计
- 20.1.1 系统整体结构
- 20.1.2 系统流程
- 20.2 运行环境
- 20.2.1 Python环境
- 20.2.2 TensorFlow环境
- 20.2.3 models环境
- 20.3 模块实现
- 20.3.1 数据预处理
- 20.3.2 模型构建
- 20.3.3 模型训练及保存
- 20.4 系统测试
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。