主编推荐语
一本机器学习算法方面的理论+实践读物。
内容简介
本书主要包含机器学习基础理论、回归模型、分类模型、聚类模型、降维模型和深度学习模型六大部分。
机器学习基础理论部分包含第1、2章,主要介绍机器学习的理论基础和工程实践基础。第3章是回归模型部分,主要包括模型的建立、学习策略的确定和优化算法的求解过程,最后结合三种常见的线性回归模型实现了一个房价预测的案例。
第4至11章详细介绍了几种常见的分类模型,包括朴素贝叶斯模型、K近邻模型、决策树模型、Logistic回归模型、支持向量机模型、随机森林模型、AdaBoost模型和提升树模型,每一个模型都给出了较为详细的推导过程和实际应用案例。
第12章系统介绍了五种常见的聚类模型,包括K-Means聚类、层次聚类、密度聚类、谱聚类和高斯混合聚类,每一个模型的原理、优缺点和工程应用实践都给出了较为详细的说明。第13章系统介绍了四种常用的降维方式,包括奇异值分解、主成分分析、线性判别分析和局部线性嵌入,同样给出了详细的理论推导和分析。
最后两章分别是词向量模型和深度神经网络模型,其中,词向量模型详细介绍了Word2Vec和Doc2Vec模型的原理推导和应用;深度神经网络模型系统介绍了深度学习相关的各类基础知识。
本书适合对人工智能和机器学习感兴趣的学生、求职者和已工作人士,以及想要使用机器学习这一工具的跨行业者(有最基本的高等数学、线性代数、概率基础即可),具体判别方法建议您阅读本书的前言。
目录
- 版权信息
- 前言
- 第1章 机器学习概述
- 1.1 机器学习介绍
- 1.1.1 机器学习的特点
- 1.1.2 机器学习的对象
- 1.1.3 机器学习的应用
- 1.2 机器学习分类
- 1.2.1 按任务类型分类
- 1.2.2 按学习方式分类
- 1.2.3 生成模型与判别模型
- 1.3 机器学习方法三要素
- 1.3.1 模型
- 1.3.2 策略
- 1.3.3 算法
- 1.3.4 小结
- 第2章 机器学习工程实践
- 2.1 模型评估指标
- 2.1.1 回归模型的评估指标
- 2.1.2 分类模型的评估指标
- 2.1.3 聚类模型的评估指标
- 2.1.4 常用距离公式
- 2.2 模型复杂度度量
- 2.2.1 偏差与方差
- 2.2.2 过拟合与正则化
- 2.3 特征工程与模型调优
- 2.3.1 数据挖掘项目流程
- 2.3.2 特征工程
- 2.3.3 模型选择与模型调优
- 第3章 线性回归
- 3.1 问题引入
- 3.2 线性回归模型
- 3.2.1 模型建立
- 3.2.2 策略确定
- 3.2.3 算法求解
- 3.2.4 线性回归模型流程
- 3.3 线性回归的scikit-learn实现
- 3.3.1 普通线性回归
- 3.3.2 Lasso回归
- 3.3.3 岭回归
- 3.3.4 ElasticNet回归
- 3.4 线性回归实例
- 3.5 小结
- 第4章 朴素贝叶斯
- 4.1 概述
- 4.2 相关原理
- 4.2.1 朴素贝叶斯基本原理
- 4.2.2 原理的进一步阐述
- 4.2.3 后验概率最大化的含义
- 4.2.4 拉普拉斯平滑
- 4.3 朴素贝叶斯的三种形式及scikit-learn实现
- 4.3.1 高斯型
- 4.3.2 多项式型
- 4.3.3 伯努利型
- 4.4 中文文本分类项目
- 4.4.1 项目简介
- 4.4.2 项目过程
- 4.4.3 完整程序实现
- 4.5 小结
- 第5章 K近邻
- 5.1 概述
- 5.2 K近邻分类原理
- 5.2.1 K值的选择
- 5.2.2 距离度量
- 5.2.3 分类决策规则
- 5.2.4 K近邻分类算法过程
- 5.3 K近邻回归原理
- 5.3.1 回归决策规则
- 5.3.2 K近邻回归算法过程
- 5.4 搜索优化——KD树
- 5.4.1 构造KD树
- 5.4.2 搜索KD树
- 5.5 K近邻的scikit-learn实现
- 5.5.1 K近邻分类
- 5.5.2 K近邻回归
- 5.6 K近邻应用实例
- 5.7 小结
- 第6章 决策树
- 6.1 概述
- 6.2 特征选择
- 6.2.1 信息增益
- 6.2.2 信息增益比
- 6.2.3 基尼系数
- 6.3 决策树的生成
- 6.3.1 ID3决策树
- 6.3.2 C4.5决策树
- 6.3.3 CART决策树
- 6.4 决策树的剪枝
- 6.5 决策树的scikit-learn实现
- 6.6 决策树应用于文本分类
- 6.7 小结
- 第7章 Logistic回归
- 7.1 Logistic回归概述
- 7.2 Logistic回归原理
- 7.2.1 Logistic回归模型
- 7.2.2 Logistic回归学习策略
- 7.2.3 Logistic回归优化算法
- 7.3 多项Logistic回归
- 7.4 Logistic回归的scikit-learn实现
- 7.5 Logistic回归实例
- 7.6 小结
- 第8章 支持向量机
- 8.1 感知机
- 8.1.1 感知机模型
- 8.1.2 感知机学习策略
- 8.1.3 感知机优化算法
- 8.1.4 感知机模型整体流程
- 8.1.5 小结
- 8.2 硬间隔支持向量机
- 8.2.1 引入
- 8.2.2 推导
- 8.3 软间隔支持向量机
- 8.4 合页损失函数
- 8.5 非线性支持向量机
- 8.6 SVM模型的scikit-learn实现
- 8.6.1 线性SVM模型
- 8.6.2 非线性SVM模型
- 8.7 SVM模型实例
- 8.8 小结
- 第9章 随机森林
- 9.1 Bagging模型
- 9.2 随机森林
- 9.3 RF的推广——extra trees
- 9.4 RF的scikit-learn实现
- 9.5 RF的scikit-learn使用实例
- 9.5.1 程序
- 9.5.2 结果及分析
- 9.5.3 扩展
- 9.6 小结
- 第10章 AdaBoost
- 10.1 AdaBoost的结构
- 10.1.1 AdaBoost的工作过程
- 10.1.2 AdaBoost多分类问题
- 10.1.3 AdaBoost的回归问题
- 10.2 AdaBoost的原理
- 10.3 AdaBoost的scikit-learn实现
- 10.4 AdaBoost使用实例
- 10.5 AdaBoost的优/缺点
- 第11章 提升树
- 11.1 提升树的定义
- 11.2 梯度提升树
- 11.2.1 梯度提升树的原理推导
- 11.2.2 GBDT和GBRT模型的处理过程
- 11.2.3 梯度提升模型的scikit-learn实现
- 11.2.4 梯度提升模型的scikit-learn使用实例
- 11.2.5 GBDT模型的优/缺点
- 11.3 XGBoost
- 11.3.1 XGBoost的原理
- 11.3.2 XGBoost调参
- 11.3.3 XGBoost与GBDT的比较
- 第12章 聚类
- 12.1 聚类问题介绍
- 12.2 K-Means聚类
- 12.2.1 K-Means聚类过程和原理
- 12.2.2 K-Means算法优化
- 12.2.3 小结
- 12.2.4 K-Means应用实例
- 12.3 层次聚类
- 12.3.1 层次聚类的过程和原理
- 12.3.2 小结
- 12.3.3 层次聚类应用实例
- 12.4 密度聚类
- 12.4.1 密度聚类过程和原理
- 12.4.2 小结
- 12.4.3 密度聚类应用实例
- 12.5 谱聚类
- 12.5.1 谱聚类的过程和原理
- 12.5.2 小结
- 12.5.3 谱聚类应用实例
- 12.6 高斯混合聚类
- 12.6.1 高斯混合聚类过程和原理
- 12.6.2 EM算法
- 12.6.3 小结
- 12.6.4 GMM应用实例
- 第13章 降维
- 13.1 奇异值分解
- 13.1.1 矩阵的特征分解
- 13.1.2 奇异值分解
- 13.2 主成分分析
- 13.2.1 PCA原理推导
- 13.2.2 核化PCA
- 13.2.3 PCA/KPCA的scikit-learn实现
- 13.3 线性判别分析
- 13.3.1 LDA原理推导
- 13.3.2 LDA与PCA的比较
- 13.3.3 LDA应用实例
- 13.4 局部线性嵌入
- 13.4.1 局部线性嵌入介绍
- 13.4.2 局部线性嵌入过程和原理
- 13.4.3 LLE应用实例
- 第14章 Word2Vec和Doc2Vec词向量模型
- 14.1 Word2Vec
- 14.1.1 Word2Vec概述
- 14.1.2 基于Hierarchical Softmax方法的CBOW模型
- 14.1.3 基于Hierarchical Softmax方法的Skip-Gram模型
- 14.1.4 基于Negative Sampling方法的CBOW模型
- 14.1.5 基于Negative Sampling方法的Skip-Gram模型
- 14.1.6 Word2Vec应用实例
- 14.2 Doc2Vec模型
- 14.2.1 Doc2Vec模型原理
- 14.2.2 Doc2Vec应用实例
- 第15章 深度神经网络模型
- 15.1 深度学习
- 15.1.1 概述
- 15.1.2 深度学习发展历史
- 15.2 神经网络原理
- 15.2.1 前向传播
- 15.2.2 反向传播
- 15.2.3 实例
- 15.2.4 几种常用激活函数
- 15.2.5 梯度消失与梯度爆炸
- 15.2.6 几种常用的优化算法
- 15.3 神经网络应用实例
- 15.4 小结
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。