展开全部

主编推荐语

全面介绍了可解释模型、黑盒模型的可解释性、与模型无关的方法。包含各种解释方法优缺点,以及每种方法的软件实现。

内容简介

机器学习虽然对改进产品性能和推进研究有很大的潜力,但无法对它们的预测转化解释,这是当前面临的一大障碍。

本书探索了可解释性的概念,介绍了简单的,可解释的模型,例如决策树,决策规则和线性回归,重点介绍了黑匣子模型的,与模型无关的方法,如特征特征和累积局部效应,以及用Shapley值和LIME解释单独实例预测。本书对所有的解释方法进行了深入的说明和批判性讨论,例如它们如何在黑盒下工作,它们的优缺点是书的重点是介绍表格式数据的机器学习模型,从而涉及计算机视觉和自然语言处理任务。

从业者,数据科学家,统计家和所有对使机器学习模型具有可解释性研究的人阅读。

目录

  • 版权信息
  • 内容简介
  • 推荐序一
  • 推荐序二
  • 作者序
  • 译者序
  • 第1章 引言
  • 1.1 故事时间
  • 1.1.1 闪电不会击中两次
  • 1.1.2 信任倒下
  • 1.1.3 费米的回形针
  • 1.2 什么是机器学习
  • 1.3 术语
  • 第2章 可解释性
  • 2.1 可解释性的重要性
  • 2.2 可解释性方法的分类
  • 2.3 可解释性的范围
  • 2.3.1 算法透明度
  • 2.3.2 全局、整体的模型可解释性
  • 2.3.3 模块层面上的全局模型可解释性
  • 2.3.4 单个预测的局部可解释性
  • 2.3.5 一组预测的局部可解释性
  • 2.4 可解释性评估
  • 2.5 解释的性质
  • 2.6 人性化的解释
  • 2.6.1 什么是解释
  • 2.6.2 什么是好的解释
  • 第3章 数据集
  • 3.1 自行车租赁(回归)
  • 3.2 YouTube 垃圾评论(文本分类)
  • 3.3 宫颈癌的危险因素(分类)
  • 第4章 可解释的模型
  • 4.1 线性回归
  • 4.1.1 解释
  • 4.1.2 示例
  • 4.1.3 可视化解释
  • 4.1.4 解释单个实例预测
  • 4.1.5 分类特征的编码
  • 4.1.6 线性模型是否有很好的解释
  • 4.1.7 稀疏线性模型
  • 4.1.8 优点
  • 4.1.9 缺点
  • 4.2 逻辑回归
  • 4.2.1 线性回归用于分类有什么问题
  • 4.2.2 理论
  • 4.2.3 解释
  • 4.2.4 示例
  • 4.2.5 优缺点
  • 4.2.6 软件
  • 4.3 GLM、GAM 和其他模型
  • 4.3.1 非高斯结果输出——GLM
  • 4.3.2 交互
  • 4.3.3 非线性效应——GAM
  • 4.3.4 优点
  • 4.3.5 缺点
  • 4.3.6 软件
  • 4.3.7 进一步扩展
  • 4.4 决策树
  • 4.4.1 解释
  • 4.4.2 示例
  • 4.4.3 优点
  • 4.4.4 缺点
  • 4.4.5 软件
  • 4.5 决策规则
  • 4.5.1 OneR
  • 4.5.2 顺序覆盖
  • 4.5.3 贝叶斯规则列表
  • 4.5.4 优点
  • 4.5.5 缺点
  • 4.5.6 软件和替代方法
  • 4.6 RuleFit
  • 4.6.1 解释和示例
  • 4.6.2 理论
  • 4.6.3 优点
  • 4.6.4 缺点
  • 4.6.5 软件和替代方法
  • 4.7 其他可解释模型
  • 4.7.1 朴素贝叶斯分类器
  • 4.7.2 k-近邻
  • 第5章 与模型无关的方法
  • 5.1 部分依赖图
  • 5.1.1 示例
  • 5.1.2 优点
  • 5.1.3 缺点
  • 5.1.4 软件和替代方法
  • 5.2 个体条件期望
  • 5.2.1 示例
  • 5.2.2 优点
  • 5.2.3 缺点
  • 5.2.4 软件和替代方法
  • 5.3 累积局部效应图
  • 5.3.1 动机和直觉
  • 5.3.2 理论
  • 5.3.3 ALE 图的估计
  • 5.3.4 示例
  • 5.3.5 优点
  • 5.3.6 缺点
  • 5.3.7 软件和替代方法
  • 5.4 特征交互
  • 5.4.1 特征交互的概念
  • 5.4.2 理论:弗里德曼的H 统计量
  • 5.4.3 示例
  • 5.4.4 优点
  • 5.4.5 缺点
  • 5.4.6 实现
  • 5.4.7 替代方法
  • 5.5 置换特征重要性
  • 5.5.1 理论
  • 5.5.2 应该计算训练数据的重要性还是测试数据的重要性
  • 5.5.3 示例和解释
  • 5.5.4 优点
  • 5.5.5 缺点
  • 5.5.6 软件和替代方法
  • 5.6 全局代理模型
  • 5.6.1 理论
  • 5.6.2 示例
  • 5.6.3 优点
  • 5.6.4 缺点
  • 5.6.5 软件
  • 5.7 局部代理模型(LIME)
  • 5.7.1 表格数据的LIME
  • 5.7.2 文本的LIME
  • 5.7.3 图像的LIME
  • 5.7.4 优点
  • 5.7.5 缺点
  • 5.8 Shapley 值
  • 5.8.1 总体思路
  • 5.8.2 示例与解释
  • 5.8.3 详细的Shapley 值
  • 5.8.4 优点
  • 5.8.5 缺点
  • 5.8.6 软件和替代方法
  • 5.9 SHAP
  • 5.9.1 SHAP 的定义
  • 5.9.2 KernelSHAP
  • 5.9.3 TreeSHAP
  • 5.9.4 示例
  • 5.9.5 SHAP 特征重要性
  • 5.9.6 SHAP 概要图
  • 5.9.7 SHAP 依赖图
  • 5.9.8 SHAP 交互值
  • 5.9.9 聚类SHAP 值
  • 5.9.10 优点
  • 5.9.11 缺点
  • 5.9.12 软件
  • 第6章 基于样本的解释
  • 6.1 反事实解释
  • 6.1.1 生成反事实解释
  • 6.1.2 示例
  • 6.1.3 优点
  • 6.1.4 缺点
  • 6.1.5 软件和替代方法
  • 6.2 对抗样本
  • 6.2.1 方法与示例
  • 6.2.2 网络安全视角
  • 6.3 原型与批评
  • 6.3.1 理论
  • 6.3.2 示例
  • 6.3.3 优点
  • 6.3.4 缺点
  • 6.3.5 软件和替代方法
  • 6.4 有影响力的实例
  • 6.4.1 删除诊断
  • 6.4.2 影响函数
  • 6.4.3 识别有影响力的实例的优点
  • 6.4.4 识别有影响力的实例的缺点
  • 6.4.5 软件和替代方法
  • 第7章 水晶球
  • 7.1 机器学习的未来
  • 7.2 可解释性的未来
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分
  • 加载中...

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。