科技
类型
可以朗读
语音朗读
342千字
字数
2025-02-01
发行日期
展开全部
主编推荐语
一本在计算机视觉学习和应用过程中的综合性指导手册。
内容简介
本书将内容分为四个部分。
第一部分是人工智能(AI)的理论知识,以此作为本书知识框架的基础。从AI的历史开篇,深入浅出地讲解计算机视觉中的数学知识、神经网络的基础架构以及常见的算法评估标准。
第二部分是人工智能(AI)产品质量体系建设实践,以计算机视觉(CV)系统为例讲解AI系统的测试策略。从传统软件测试与AI系统测试的异同开始,探讨工程、数据、模型三个维度的质量建设方法。这里会涉及数据采集、数据增强和模型的分层测试技术。此部分可以帮组读者了解如何去构建一个针对AI产品的质量保障体系。
第三部分是智能化测试探索,讨论计算机视觉(CV)技术在是测试中的具体应用。探索利用深度学习构建的异常检测机制,以及讨论CV技术在UI遍历测试中的具体运用场景。最后,我们延伸到大模型,介绍了其在评测与文生图上的应用示例。
第四部分是大语言模型(LLM)应用与评测,介绍大语言模型基础知识、在测试领域的应用与评测技术等。从大语言模型的定义开始,介绍了LLM演进历史、应用场景与技术、以及局限性。并对其在测试领域应用,进行了示例说明。然后,我们探讨了大语言模型在图像领域的应用,解释了大语言模型基础能力、文生图能力、文生视频能力等三种能力的评测技术与指标框架。
目录
- 版权信息
- 作者简介
- 前言
- 第1章 人工智能的前世今生
- 1.1 人工智能的诞生
- 1.2 人工智能发展的 “强”与“弱”
- 1.3 人工智能的三个重要分支
- 1.3.1 语音识别与合成
- 1.3.2 自然语言处理
- 1.3.3 计算机视觉
- 1.4 人工智能的道德问题
- 1.5 本章小结
- 第2章 AI的数学逻辑
- 2.1 神经网络中的函数介绍
- 2.1.1 一次函数
- 2.1.2 二次函数
- 2.1.3 单位阶跃函数
- 2.1.4 指数函数与Sigmoid函数
- 2.1.5 高斯函数
- 2.2 导数基础
- 2.2.1 斜率
- 2.2.2 导数
- 2.2.3 导数的运算规则
- 2.3 矩阵
- 2.3.1 矩阵是什么
- 2.3.2矩阵的运算法则
- 2.3.3矩阵在神经网络中的应用
- 2.4 总结
- 第3章 计算机视觉知识背景
- 3.1 图像知识简介
- 3.2 OpenCV介绍
- 3.2.1 OpenCV概述
- 3.2.2 为什么用OpenCV
- 3.3 图像基础操作
- 3.3.1 获取图像的基本信息
- 3.3.2灰度化和二值化
- 3.3.3 图像旋转和缩放
- 3.3.4 图像直方图
- 3.3.5 图像的腐蚀和膨胀
- 3.3.5水平和竖直投影
- 3.3.6图像模版匹配
- 3.4 总结
- 第4章 神经网络入门
- 4.1 神经网络
- 4.1.1初步理解神经网络
- 4.1.2深入理解神经网络
- 4.2 训练集和测试集
- 4.2.1训练集和测试独立同分布
- 4.2.2 合理划分数据集
- 4.3 重要概念介绍
- 4.3.1神经元
- 4.3.2激活函数
- 4.3.3输入层/输出层/隐含层
- 4.3.4学习率
- 4.3.5过拟合和欠拟合
- 4.4 总结
- 第5章 算法模型的评估指标
- 5.1 混淆矩阵
- 5.2 准确率
- 5.3 召回率和精准率
- 5.4 ROC与AUC
- 5.5 KS曲线
- 5.6 CMC曲线
- 5.7 FAR、FRR和TAR
- 5.8 IOU
- 5.9 AP和mAP
- 5.10 图像质量评测
- 5.10.1 SNR和PSNR
- 5.10.2 SSIM
- 5.10.3 无参考锐化因子CPBD
- 5.10.4 主观评价方法
- 5.11 总结
- 第6章 AI工程质量
- 6.1 AI产品研发流程
- 6.2 AI产品质量体系
- 6.3 工程质量模型
- 6.4 工程质量保障手段
- 6.4.1 V型测试模型
- 6.4.2 测试金字塔
- 6.5 工程质量评估
- 6.5.1 质量模型覆盖度
- 6.5.2 代码覆盖率
- 6.5.3 缺陷过程分析
- 6.6 总结
- 6.7 参考文献
- 第7章 AI数据质量
- 7.1 数据驱动AI模型
- 7.2 AI数据采集流程
- 7.3 AI数据的采集量
- 7.3.1数据采集量的影响
- 7.3.2 数据采集量的选择
- 7.3.3数据采集量之10倍原则
- 7.4 AI数据质量评估
- 7.4.1 准确性(Accuracy)
- 7.4.2 完整性(Completeness)
- 7.4.3 一致性(Consistency)
- 7.4.4 及时性(Timeliness)
- 7.4.5 有效性(Validity)
- 7.4.6 公平性(Unbais)
- 7.4.7典型的数据采集问题
- 7.5 样本数据快速扩充
- 7.5.1 基于CV图像增强生成数据
- 7.5.2 基于AI合成数据
- 7.5.3 基于扩散模型(Diffusion Model)合成数据
- 7.5.4 基于3D渲染引擎生成数据
- 7.6 合成数据的质量评估
- 7.6.1 基于数据增强合成数据的局限性
- 7.6.2 基于AI合成数据的局限性
- 7.6.3 合成数据的质量评估
- 7.7 基于智能硬件的数据采集及标注方案
- 7.7.1 基于机械臂的数据自动化采集方案
- 7.7.2基于透视变换的数据自动化标注方案
- 7.8 AI数据管理
- 7.8.1 数据管理
- 7.8.2 数据安全
- 7.9 总结
- 7.10 参考文献
- 第8章 AI模型质量
- 8.1 AI模型测试的基本流程
- 8.2 AI模型质量评估
- 8.2.1 AI模型评估指标
- 8.2.2 AI模型覆盖率指标
- 8.2.3 基于神经元的覆盖率指标
- 8.2.4 基于神经网络层的覆盖率指标
- 8.3 AI模型的黑盒测试
- 8.3.1 端到端的黑盒测试
- 8.3.2 AI算法的分层测试
- 8.3.3 AI模型的蜕变测试
- 8.4 AI模型的灰盒精准测试
- 8.4.2 AI模型的可解释性
- 8.4.3 Grad-CAM热力图
- 8.4.4 AI模型的精准测试
- 8.5 AI模型的白盒测试
- 8.5.1 Fuzz测试基本原理
- 8.5.2 DeepTest简介
- 8.5.3 TensorFuzz简介
- 8.6 AI模型质量小结
- 8.7 参考文献
- 第9章 智能UI自动化
- 9.1 传统的UI测试及工具
- 9.2 测试场景与可测性分析
- 9.3 技术发展方向
- 9.4 总结
- 第10章 UI异常检测
- 10.1 异常检测的概念
- 10.2 测试策略分析
- 10.2.1 基于颜色和纹理的算法
- 10.2.2 基于边缘检测的算法
- 10.2.3 基于特征匹配的算法
- 10.2.4 基于深度学习的算法
- 10.2.5 测试实现方案
- 10.3 深度学习算法分析
- 10.3.1 图像分类
- 10.3.2 目标识别
- 10.3.3 算法的演进
- 10.3.4 网络结构
- 10.4 算法实现与工程实践
- 10.4.1 图片缺失
- 10.4.2 文字重叠
- 10.4.3 乱码
- 10.4.4 算法开发实践
- 10.4.4.5 算法迭代优化
- 10.4.5 异常检测的工程实践
- 10.5 本章小结
- 第11章 UI遍历技术
- 11.1 UI遍历技术的介绍
- 11.1.1 UI遍历技术定义
- 11.1.2 UI遍历工具演变史
- 11.1.3 UI遍历和Monkey有什么区别
- 11.1.4 UI遍历可以在DevOps哪些阶段使用
- 11.2 UI遍历技术的实现
- 11.2.1 遍历技术的设计架构
- 11.2.2 工具是如何与APP交互的
- 11.2.3 UI遍历逻辑
- 11.2.4.UI遍历模式
- 11.2.5 如何获取页面中可以操作的元素?
- 11.2.6 如何进行断言?
- 11.3 计算机视觉技术在遍历中的应用
- 11.3.1基于AI的遍历模式
- 11.3.2基于图像技术的断言方法
- 11.3.3 基于AI识别图标
- 11.3.4 OpenCV在遍历中的应用
- 11.4 智能测试图像服务
- 11.5 总结
- 第12章 迎接大模型时代
- 12.1 大语言模型简介
- 12.1.1 大语言模型的定义
- 12.1.2 大语言模型的演进
- 12.1.3 图像合成的技术演进
- 12.1.4 ChatGPT
- 12.1.5 大语言模型的应用场景
- 12.1.6 大模型的局限性
- 12.2 大语言模型应用技术
- 12.2.1 提示词工程(Prompt Engineering)
- 12.2.2 提示词工程小技巧
- 12.2.3思维链(Chain of Thought,CoT)
- 12.2.4 检索增强生成(RAG)
- 12.2.5人工智能代理(AI Agent)
- 12.3 总结
- 12.4 参考文献
- 第13章 大模型在计算机视觉上的测试应用
- 13.1 基于ChatGPT的测试用例设计
- 13.2 基于AIGC的数据生成
- 13.2.1 图像生成
- 13.2.2 视频生成
- 13.2.3 3D模型生成
- 13.2.4 3D场景生成
- 13.3 大语言模型基础能力评测
- 13.3.1 大语言模型的评测流程
- 13.3.2 HELM评测
- 13.3.3SuperCLUE评测
- 13.4 大语言模型文生图能力评测
- 13.4.1 HPS
- 13.4.2 TIFA
- 13.4.3 PickScore
- 13.4.4LLMScore
- 13.4.5 SuperCLUE-Image
- 13.5 大语言模型文生视频能力评测
- 13.5.1 视频质量评测的重要性
- 13.5.2 VBench评测标准
- 13.5.2SuperCLUE-Video评测标准
- 13.6 总结
- 13.7 参考文献
- 后记
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。