展开全部

主编推荐语

一本机器学习算法方面的理论+实践读物。

内容简介

本书主要包含机器学习基础理论、回归模型、分类模型、聚类模型、降维模型和深度学习模型六大部分。

机器学习基础理论部分包含第1、2章,主要介绍机器学习的理论基础和工程实践基础。第3章是回归模型部分,主要包括模型的建立、学习策略的确定和优化算法的求解过程,最后结合三种常见的线性回归模型实现了一个房价预测的案例。

第4至11章详细介绍了几种常见的分类模型,包括朴素贝叶斯模型、K近邻模型、决策树模型、Logistic回归模型、支持向量机模型、随机森林模型、AdaBoost模型和提升树模型,每一个模型都给出了较为详细的推导过程和实际应用案例。

第12章系统介绍了五种常见的聚类模型,包括K-Means聚类、层次聚类、密度聚类、谱聚类和高斯混合聚类,每一个模型的原理、优缺点和工程应用实践都给出了较为详细的说明。第13章系统介绍了四种常用的降维方式,包括奇异值分解、主成分分析、线性判别分析和局部线性嵌入,同样给出了详细的理论推导和分析。

最后两章分别是词向量模型和深度神经网络模型,其中,词向量模型详细介绍了Word2Vec和Doc2Vec模型的原理推导和应用;深度神经网络模型系统介绍了深度学习相关的各类基础知识。

本书适合对人工智能和机器学习感兴趣的学生、求职者和已工作人士,以及想要使用机器学习这一工具的跨行业者(有最基本的高等数学、线性代数、概率基础即可),具体判别方法建议您阅读本书的前言。

目录

  • 版权信息
  • 前言
  • 第1章 机器学习概述
  • 1.1 机器学习介绍
  • 1.1.1 机器学习的特点
  • 1.1.2 机器学习的对象
  • 1.1.3 机器学习的应用
  • 1.2 机器学习分类
  • 1.2.1 按任务类型分类
  • 1.2.2 按学习方式分类
  • 1.2.3 生成模型与判别模型
  • 1.3 机器学习方法三要素
  • 1.3.1 模型
  • 1.3.2 策略
  • 1.3.3 算法
  • 1.3.4 小结
  • 第2章 机器学习工程实践
  • 2.1 模型评估指标
  • 2.1.1 回归模型的评估指标
  • 2.1.2 分类模型的评估指标
  • 2.1.3 聚类模型的评估指标
  • 2.1.4 常用距离公式
  • 2.2 模型复杂度度量
  • 2.2.1 偏差与方差
  • 2.2.2 过拟合与正则化
  • 2.3 特征工程与模型调优
  • 2.3.1 数据挖掘项目流程
  • 2.3.2 特征工程
  • 2.3.3 模型选择与模型调优
  • 第3章 线性回归
  • 3.1 问题引入
  • 3.2 线性回归模型
  • 3.2.1 模型建立
  • 3.2.2 策略确定
  • 3.2.3 算法求解
  • 3.2.4 线性回归模型流程
  • 3.3 线性回归的scikit-learn实现
  • 3.3.1 普通线性回归
  • 3.3.2 Lasso回归
  • 3.3.3 岭回归
  • 3.3.4 ElasticNet回归
  • 3.4 线性回归实例
  • 3.5 小结
  • 第4章 朴素贝叶斯
  • 4.1 概述
  • 4.2 相关原理
  • 4.2.1 朴素贝叶斯基本原理
  • 4.2.2 原理的进一步阐述
  • 4.2.3 后验概率最大化的含义
  • 4.2.4 拉普拉斯平滑
  • 4.3 朴素贝叶斯的三种形式及scikit-learn实现
  • 4.3.1 高斯型
  • 4.3.2 多项式型
  • 4.3.3 伯努利型
  • 4.4 中文文本分类项目
  • 4.4.1 项目简介
  • 4.4.2 项目过程
  • 4.4.3 完整程序实现
  • 4.5 小结
  • 第5章 K近邻
  • 5.1 概述
  • 5.2 K近邻分类原理
  • 5.2.1 K值的选择
  • 5.2.2 距离度量
  • 5.2.3 分类决策规则
  • 5.2.4 K近邻分类算法过程
  • 5.3 K近邻回归原理
  • 5.3.1 回归决策规则
  • 5.3.2 K近邻回归算法过程
  • 5.4 搜索优化——KD树
  • 5.4.1 构造KD树
  • 5.4.2 搜索KD树
  • 5.5 K近邻的scikit-learn实现
  • 5.5.1 K近邻分类
  • 5.5.2 K近邻回归
  • 5.6 K近邻应用实例
  • 5.7 小结
  • 第6章 决策树
  • 6.1 概述
  • 6.2 特征选择
  • 6.2.1 信息增益
  • 6.2.2 信息增益比
  • 6.2.3 基尼系数
  • 6.3 决策树的生成
  • 6.3.1 ID3决策树
  • 6.3.2 C4.5决策树
  • 6.3.3 CART决策树
  • 6.4 决策树的剪枝
  • 6.5 决策树的scikit-learn实现
  • 6.6 决策树应用于文本分类
  • 6.7 小结
  • 第7章 Logistic回归
  • 7.1 Logistic回归概述
  • 7.2 Logistic回归原理
  • 7.2.1 Logistic回归模型
  • 7.2.2 Logistic回归学习策略
  • 7.2.3 Logistic回归优化算法
  • 7.3 多项Logistic回归
  • 7.4 Logistic回归的scikit-learn实现
  • 7.5 Logistic回归实例
  • 7.6 小结
  • 第8章 支持向量机
  • 8.1 感知机
  • 8.1.1 感知机模型
  • 8.1.2 感知机学习策略
  • 8.1.3 感知机优化算法
  • 8.1.4 感知机模型整体流程
  • 8.1.5 小结
  • 8.2 硬间隔支持向量机
  • 8.2.1 引入
  • 8.2.2 推导
  • 8.3 软间隔支持向量机
  • 8.4 合页损失函数
  • 8.5 非线性支持向量机
  • 8.6 SVM模型的scikit-learn实现
  • 8.6.1 线性SVM模型
  • 8.6.2 非线性SVM模型
  • 8.7 SVM模型实例
  • 8.8 小结
  • 第9章 随机森林
  • 9.1 Bagging模型
  • 9.2 随机森林
  • 9.3 RF的推广——extra trees
  • 9.4 RF的scikit-learn实现
  • 9.5 RF的scikit-learn使用实例
  • 9.5.1 程序
  • 9.5.2 结果及分析
  • 9.5.3 扩展
  • 9.6 小结
  • 第10章 AdaBoost
  • 10.1 AdaBoost的结构
  • 10.1.1 AdaBoost的工作过程
  • 10.1.2 AdaBoost多分类问题
  • 10.1.3 AdaBoost的回归问题
  • 10.2 AdaBoost的原理
  • 10.3 AdaBoost的scikit-learn实现
  • 10.4 AdaBoost使用实例
  • 10.5 AdaBoost的优/缺点
  • 第11章 提升树
  • 11.1 提升树的定义
  • 11.2 梯度提升树
  • 11.2.1 梯度提升树的原理推导
  • 11.2.2 GBDT和GBRT模型的处理过程
  • 11.2.3 梯度提升模型的scikit-learn实现
  • 11.2.4 梯度提升模型的scikit-learn使用实例
  • 11.2.5 GBDT模型的优/缺点
  • 11.3 XGBoost
  • 11.3.1 XGBoost的原理
  • 11.3.2 XGBoost调参
  • 11.3.3 XGBoost与GBDT的比较
  • 第12章 聚类
  • 12.1 聚类问题介绍
  • 12.2 K-Means聚类
  • 12.2.1 K-Means聚类过程和原理
  • 12.2.2 K-Means算法优化
  • 12.2.3 小结
  • 12.2.4 K-Means应用实例
  • 12.3 层次聚类
  • 12.3.1 层次聚类的过程和原理
  • 12.3.2 小结
  • 12.3.3 层次聚类应用实例
  • 12.4 密度聚类
  • 12.4.1 密度聚类过程和原理
  • 12.4.2 小结
  • 12.4.3 密度聚类应用实例
  • 12.5 谱聚类
  • 12.5.1 谱聚类的过程和原理
  • 12.5.2 小结
  • 12.5.3 谱聚类应用实例
  • 12.6 高斯混合聚类
  • 12.6.1 高斯混合聚类过程和原理
  • 12.6.2 EM算法
  • 12.6.3 小结
  • 12.6.4 GMM应用实例
  • 第13章 降维
  • 13.1 奇异值分解
  • 13.1.1 矩阵的特征分解
  • 13.1.2 奇异值分解
  • 13.2 主成分分析
  • 13.2.1 PCA原理推导
  • 13.2.2 核化PCA
  • 13.2.3 PCA/KPCA的scikit-learn实现
  • 13.3 线性判别分析
  • 13.3.1 LDA原理推导
  • 13.3.2 LDA与PCA的比较
  • 13.3.3 LDA应用实例
  • 13.4 局部线性嵌入
  • 13.4.1 局部线性嵌入介绍
  • 13.4.2 局部线性嵌入过程和原理
  • 13.4.3 LLE应用实例
  • 第14章 Word2Vec和Doc2Vec词向量模型
  • 14.1 Word2Vec
  • 14.1.1 Word2Vec概述
  • 14.1.2 基于Hierarchical Softmax方法的CBOW模型
  • 14.1.3 基于Hierarchical Softmax方法的Skip-Gram模型
  • 14.1.4 基于Negative Sampling方法的CBOW模型
  • 14.1.5 基于Negative Sampling方法的Skip-Gram模型
  • 14.1.6 Word2Vec应用实例
  • 14.2 Doc2Vec模型
  • 14.2.1 Doc2Vec模型原理
  • 14.2.2 Doc2Vec应用实例
  • 第15章 深度神经网络模型
  • 15.1 深度学习
  • 15.1.1 概述
  • 15.1.2 深度学习发展历史
  • 15.2 神经网络原理
  • 15.2.1 前向传播
  • 15.2.2 反向传播
  • 15.2.3 实例
  • 15.2.4 几种常用激活函数
  • 15.2.5 梯度消失与梯度爆炸
  • 15.2.6 几种常用的优化算法
  • 15.3 神经网络应用实例
  • 15.4 小结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。