展开全部

主编推荐语

一本在计算机视觉学习和应用过程中的综合性指导手册。

内容简介

本书将内容分为四个部分。

第一部分是人工智能(AI)的理论知识,以此作为本书知识框架的基础。从AI的历史开篇,深入浅出地讲解计算机视觉中的数学知识、神经网络的基础架构以及常见的算法评估标准。

第二部分是人工智能(AI)产品质量体系建设实践,以计算机视觉(CV)系统为例讲解AI系统的测试策略。从传统软件测试与AI系统测试的异同开始,探讨工程、数据、模型三个维度的质量建设方法。这里会涉及数据采集、数据增强和模型的分层测试技术。此部分可以帮组读者了解如何去构建一个针对AI产品的质量保障体系。

第三部分是智能化测试探索,讨论计算机视觉(CV)技术在是测试中的具体应用。探索利用深度学习构建的异常检测机制,以及讨论CV技术在UI遍历测试中的具体运用场景。最后,我们延伸到大模型,介绍了其在评测与文生图上的应用示例。

第四部分是大语言模型(LLM)应用与评测,介绍大语言模型基础知识、在测试领域的应用与评测技术等。从大语言模型的定义开始,介绍了LLM演进历史、应用场景与技术、以及局限性。并对其在测试领域应用,进行了示例说明。然后,我们探讨了大语言模型在图像领域的应用,解释了大语言模型基础能力、文生图能力、文生视频能力等三种能力的评测技术与指标框架。

目录

  • 版权信息
  • 作者简介
  • 前言
  • 第1章 人工智能的前世今生
  • 1.1 人工智能的诞生
  • 1.2 人工智能发展的 “强”与“弱”
  • 1.3 人工智能的三个重要分支
  • 1.3.1 语音识别与合成
  • 1.3.2 自然语言处理
  • 1.3.3 计算机视觉
  • 1.4 人工智能的道德问题
  • 1.5 本章小结
  • 第2章 AI的数学逻辑
  • 2.1 神经网络中的函数介绍
  • 2.1.1 一次函数
  • 2.1.2 二次函数
  • 2.1.3 单位阶跃函数
  • 2.1.4 指数函数与Sigmoid函数
  • 2.1.5 高斯函数
  • 2.2 导数基础
  • 2.2.1 斜率
  • 2.2.2 导数
  • 2.2.3 导数的运算规则
  • 2.3 矩阵
  • 2.3.1 矩阵是什么
  • 2.3.2矩阵的运算法则
  • 2.3.3矩阵在神经网络中的应用
  • 2.4 总结
  • 第3章 计算机视觉知识背景
  • 3.1 图像知识简介
  • 3.2 OpenCV介绍
  • 3.2.1 OpenCV概述
  • 3.2.2 为什么用OpenCV
  • 3.3 图像基础操作
  • 3.3.1 获取图像的基本信息
  • 3.3.2灰度化和二值化
  • 3.3.3 图像旋转和缩放
  • 3.3.4 图像直方图
  • 3.3.5 图像的腐蚀和膨胀
  • 3.3.5水平和竖直投影
  • 3.3.6图像模版匹配
  • 3.4 总结
  • 第4章 神经网络入门
  • 4.1 神经网络
  • 4.1.1初步理解神经网络
  • 4.1.2深入理解神经网络
  • 4.2 训练集和测试集
  • 4.2.1训练集和测试独立同分布
  • 4.2.2 合理划分数据集
  • 4.3 重要概念介绍
  • 4.3.1神经元
  • 4.3.2激活函数
  • 4.3.3输入层/输出层/隐含层
  • 4.3.4学习率
  • 4.3.5过拟合和欠拟合
  • 4.4 总结
  • 第5章 算法模型的评估指标
  • 5.1 混淆矩阵
  • 5.2 准确率
  • 5.3 召回率和精准率
  • 5.4 ROC与AUC
  • 5.5 KS曲线
  • 5.6 CMC曲线
  • 5.7 FAR、FRR和TAR
  • 5.8 IOU
  • 5.9 AP和mAP
  • 5.10 图像质量评测
  • 5.10.1 SNR和PSNR
  • 5.10.2 SSIM
  • 5.10.3 无参考锐化因子CPBD
  • 5.10.4 主观评价方法
  • 5.11 总结
  • 第6章 AI工程质量
  • 6.1 AI产品研发流程
  • 6.2 AI产品质量体系
  • 6.3 工程质量模型
  • 6.4 工程质量保障手段
  • 6.4.1 V型测试模型
  • 6.4.2 测试金字塔
  • 6.5 工程质量评估
  • 6.5.1 质量模型覆盖度
  • 6.5.2 代码覆盖率
  • 6.5.3 缺陷过程分析
  • 6.6 总结
  • 6.7 参考文献
  • 第7章 AI数据质量
  • 7.1 数据驱动AI模型
  • 7.2 AI数据采集流程
  • 7.3 AI数据的采集量
  • 7.3.1数据采集量的影响
  • 7.3.2 数据采集量的选择
  • 7.3.3数据采集量之10倍原则
  • 7.4 AI数据质量评估
  • 7.4.1 准确性(Accuracy)
  • 7.4.2 完整性(Completeness)
  • 7.4.3 一致性(Consistency)
  • 7.4.4 及时性(Timeliness)
  • 7.4.5 有效性(Validity)
  • 7.4.6 公平性(Unbais)
  • 7.4.7典型的数据采集问题
  • 7.5 样本数据快速扩充
  • 7.5.1 基于CV图像增强生成数据
  • 7.5.2 基于AI合成数据
  • 7.5.3 基于扩散模型(Diffusion Model)合成数据
  • 7.5.4 基于3D渲染引擎生成数据
  • 7.6 合成数据的质量评估
  • 7.6.1 基于数据增强合成数据的局限性
  • 7.6.2 基于AI合成数据的局限性
  • 7.6.3 合成数据的质量评估
  • 7.7 基于智能硬件的数据采集及标注方案
  • 7.7.1 基于机械臂的数据自动化采集方案
  • 7.7.2基于透视变换的数据自动化标注方案
  • 7.8 AI数据管理
  • 7.8.1 数据管理
  • 7.8.2 数据安全
  • 7.9 总结
  • 7.10 参考文献
  • 第8章 AI模型质量
  • 8.1 AI模型测试的基本流程
  • 8.2 AI模型质量评估
  • 8.2.1 AI模型评估指标
  • 8.2.2 AI模型覆盖率指标
  • 8.2.3 基于神经元的覆盖率指标
  • 8.2.4 基于神经网络层的覆盖率指标
  • 8.3 AI模型的黑盒测试
  • 8.3.1 端到端的黑盒测试
  • 8.3.2 AI算法的分层测试
  • 8.3.3 AI模型的蜕变测试
  • 8.4 AI模型的灰盒精准测试
  • 8.4.2 AI模型的可解释性
  • 8.4.3 Grad-CAM热力图
  • 8.4.4 AI模型的精准测试
  • 8.5 AI模型的白盒测试
  • 8.5.1 Fuzz测试基本原理
  • 8.5.2 DeepTest简介
  • 8.5.3 TensorFuzz简介
  • 8.6 AI模型质量小结
  • 8.7 参考文献
  • 第9章 智能UI自动化
  • 9.1 传统的UI测试及工具
  • 9.2 测试场景与可测性分析
  • 9.3 技术发展方向
  • 9.4 总结
  • 第10章 UI异常检测
  • 10.1 异常检测的概念
  • 10.2 测试策略分析
  • 10.2.1 基于颜色和纹理的算法
  • 10.2.2 基于边缘检测的算法
  • 10.2.3 基于特征匹配的算法
  • 10.2.4 基于深度学习的算法
  • 10.2.5 测试实现方案
  • 10.3 深度学习算法分析
  • 10.3.1 图像分类
  • 10.3.2 目标识别
  • 10.3.3 算法的演进
  • 10.3.4 网络结构
  • 10.4 算法实现与工程实践
  • 10.4.1 图片缺失
  • 10.4.2 文字重叠
  • 10.4.3 乱码
  • 10.4.4 算法开发实践
  • 10.4.4.5 算法迭代优化
  • 10.4.5 异常检测的工程实践
  • 10.5 本章小结
  • 第11章 UI遍历技术
  • 11.1 UI遍历技术的介绍
  • 11.1.1 UI遍历技术定义
  • 11.1.2 UI遍历工具演变史
  • 11.1.3 UI遍历和Monkey有什么区别
  • 11.1.4 UI遍历可以在DevOps哪些阶段使用
  • 11.2 UI遍历技术的实现
  • 11.2.1 遍历技术的设计架构
  • 11.2.2 工具是如何与APP交互的
  • 11.2.3 UI遍历逻辑
  • 11.2.4.UI遍历模式
  • 11.2.5 如何获取页面中可以操作的元素?
  • 11.2.6 如何进行断言?
  • 11.3 计算机视觉技术在遍历中的应用
  • 11.3.1基于AI的遍历模式
  • 11.3.2基于图像技术的断言方法
  • 11.3.3 基于AI识别图标
  • 11.3.4 OpenCV在遍历中的应用
  • 11.4 智能测试图像服务
  • 11.5 总结
  • 第12章 迎接大模型时代
  • 12.1 大语言模型简介
  • 12.1.1 大语言模型的定义
  • 12.1.2 大语言模型的演进
  • 12.1.3 图像合成的技术演进
  • 12.1.4 ChatGPT
  • 12.1.5 大语言模型的应用场景
  • 12.1.6 大模型的局限性
  • 12.2 大语言模型应用技术
  • 12.2.1 提示词工程(Prompt Engineering)
  • 12.2.2 提示词工程小技巧
  • 12.2.3思维链(Chain of Thought,CoT)
  • 12.2.4 检索增强生成(RAG)
  • 12.2.5人工智能代理(AI Agent)
  • 12.3 总结
  • 12.4 参考文献
  • 第13章 大模型在计算机视觉上的测试应用
  • 13.1 基于ChatGPT的测试用例设计
  • 13.2 基于AIGC的数据生成
  • 13.2.1 图像生成
  • 13.2.2 视频生成
  • 13.2.3 3D模型生成
  • 13.2.4 3D场景生成
  • 13.3 大语言模型基础能力评测
  • 13.3.1 大语言模型的评测流程
  • 13.3.2 HELM评测
  • 13.3.3SuperCLUE评测
  • 13.4 大语言模型文生图能力评测
  • 13.4.1 HPS
  • 13.4.2 TIFA
  • 13.4.3 PickScore
  • 13.4.4LLMScore
  • 13.4.5 SuperCLUE-Image
  • 13.5 大语言模型文生视频能力评测
  • 13.5.1 视频质量评测的重要性
  • 13.5.2 VBench评测标准
  • 13.5.2SuperCLUE-Video评测标准
  • 13.6 总结
  • 13.7 参考文献
  • 后记
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。