科技
类型
可以朗读
语音朗读
154千字
字数
2021-05-01
发行日期
展开全部
主编推荐语
在机器学习算法的实际应用中,我们不仅要知道算法的原理,也要了解如何评估算法上线服务的可靠性。
内容简介
机器学习算法评估力求用科学的指标,对机器学习算法进行完整、可靠的评价。
本书详细介绍机器学习算法评估的理论、方法和实践。全书分为3个部分。
第1部分包含第1章~第3章,针对分类算法、回归算法和聚类算法分别介绍对应的基础理论和评估方法;
第2部分包含第4章~第8章,介绍更复杂的模型(如深度学习模型和集成树模型)的对比与评估,并且针对它们实际应用的业务场景介绍一些特有的评估指标和评估体系;
第3部分包含第9章~第11章,总结算法评估的常用工具、技术及方法论,包括实用的可视化工具介绍,并讨论机器学习算法的本质。
本书适合机器学习专业相关从业者和算法工程师阅读,也适合想要从事人工智能和机器学习工作的人士学习和参考。
目录
- 版权信息
- 内容提要
- 前言 PREFACE
- 写作这本书的背景
- 什么是机器学习算法评估
- 为什么需要算法评估
- 你真的会评估吗
- 评估体系的关键因素
- 实用性
- 容错程度
- 性能
- 可解释性
- 表现形式
- 本书的主要内容
- 本书的目标读者
- 致谢
- 资源与支持
- 提交错误信息
- 与我们联系
- 关于异步社区和异步图书
- 第1章 分类的艺术
- 1.1 训练集和测试集的选择
- 1.2 准召率和P-R曲线
- 1.3 ROC和AUC
- 1.5 异常检测
- 1.5 小结
- 第2章 一个好的回归算法
- 2.1 ME那些事
- 2.2 方差和偏差
- 2.3 欠拟合和过拟合
- 2.4 正则化方法
- 2.5 回归算法的对比
- 2.5.1 线性回归
- 2.5.2 局部加权线性回归
- 2.5.3 岭回归
- 2.6 梯度下降的对比
- 2.6.1 一般的梯度下降
- 2.6.2 随机梯度下降和批量梯度下降
- 2.6.3 动量梯度下降
- 2.6.4 AdaGrad、RMSProp和Adam
- 2.7 小结
- 第3章 “硬核”聚类
- 3.1 无监督学习
- 3.2 聚类算法的评估指标
- 3.2.1 霍普金斯统计量
- 3.2.2 类簇的数量
- 3.2.3 聚类效果
- 3.3 聚类算法的对比
- 3.3.1 基于密度的聚类
- 3.3.2 K-means
- 3.3.3 基于层次的聚类
- 3.3.4 基于概率的聚类
- 3.4 小结
- 第4章 慧眼识天下
- 4.1 卷积神经网络
- 4.1.1 简单的卷积神经网络
- 4.1.2 详解卷积神经网络
- 4.2 循环神经网络
- 4.2.1 图解RNN
- 4.2.2 RNN的训练
- 4.2.3 RNN的变化形式
- 4.3 更实用的模型
- 4.3.1 LSTM
- 4.3.2 Seq2Seq
- 4.3.3 注意力机制
- 4.4 小结
- 第5章 智慧的语言——NLP算法实战与评估
- 5.1 文字的预处理
- 5.1.1 嵌入
- 5.1.2 word2vec
- 5.1.3 词袋模型与TF-IDF
- 5.2 RNN文本分类
- 5.2.1 RNN文本分类的模块
- 5.2.2 参数定义
- 5.2.3 预处理
- 5.2.4 模型定义
- 5.2.5 模型训练和评估
- 5.3 HAN文本分类
- 5.3.1 HAN和GRU的基本原理
- 5.3.2 HAN的注意力层
- 5.4 NLP评估
- 5.4.1 N-gram
- 5.4.2 BLEU
- 5.4.3 ROUGE
- 5.4.4 Pointwise、Pairwise和Listwise排序算法
- 5.5 小结
- 第6章 预言家的思考
- 6.1 基础树模型的对比
- 6.1.1 ID3
- 6.1.2 C4.5
- 6.1.3 CART
- 6.2 随机森林和AdaBoost
- 6.2.1 随机森林
- 6.2.2 AdaBoost
- 6.3 GBDT
- 6.3.1 GBDT简介
- 6.3.2 GBDT和回归问题
- 6.3.3 GBDT和分类问题
- 6.4 XGBoost
- 6.4.1 XGBoost简介
- 6.4.2 XGBoost回归算法
- 6.4.3 XGBoost分类算法
- 6.4.4 XGBoost的优化方法和特征评估
- 6.4.5 GBDT和XGBoost的对比评估
- 6.5 小结
- 第7章 爱我所爱
- 7.1 多路召回
- 7.1.1 基于用户的协同过滤
- 7.1.2 基于物品的协同过滤
- 7.2 逻辑斯谛回归
- 7.2.1 逻辑斯谛回归的基本原理
- 7.2.2 逻辑斯谛回归和推荐排序
- 7.3 FM、FFM和特征组合
- 7.3.1 FM基本原理
- 7.3.2 用FFM和GBDT进行高阶特征组合
- 7.4 Wide&Deep
- 7.5 更有趣的模型——Transformer
- 7.5.1 模型整体架构
- 7.5.2 注意力机制
- 7.5.3 编码器
- 7.5.4 解码器
- 7.5.5 基于位置的前馈神经网络
- 7.5.6 嵌入层
- 7.5.7 线性层和softmax层
- 7.5.8 Transformer在推荐系统的应用
- 7.6 推荐算法的评估
- 7.6.1 准确度指标
- 7.6.2 排序指标
- 7.6.3 覆盖率
- 7.6.4 多样性和新颖性
- 7.7 小结
- 第8章 奇门遁甲
- 8.1 坐标
- 8.1.1 坐标生成
- 8.1.2 基于密度的坐标生成
- 8.1.3 基于GeoHash块热度的坐标生成
- 8.1.4 坐标质量评估
- 8.2 路线
- 8.2.1 路线相似度评估
- 8.2.2 路线规划——Dijkstra算法
- 8.2.3 路线排序
- 8.2.4 路线质量评估
- 8.3 小结
- 第9章 评估利器
- 9.1 R语言简介
- 9.1.1 为什么要可视化
- 9.1.2 R语言介绍
- 9.1.3 数据生态
- 9.2 Shiny可视化
- 9.2.1 UI布局
- 9.2.2 服务器
- 9.2.3 可视化评估示例
- 9.3 小结
- 第10章 像哲学家一样思考
- 10.1 机器学习之殇
- 鹦鹉学舌vs. 乌鸦喝水
- 10.2 辛普森悖论
- 10.3 伯克森悖论
- 10.4 智能之梯
- 10.4.1 因果推断的起源
- 10.4.2 智能之梯
- 10.5 因果推断的方法
- 10.5.1 双重差分模型
- 10.5.2 工具变量
- 10.5.3 中介模型
- 10.6 小结
- 第11章 基础评估方法
- 11.1 卡方检验
- 11.2 T检验
- 11.3 Z检验和F检验
- 11.4 小结
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。