展开全部

主编推荐语

探索机器学习与数据挖掘的奥秘,掌握机器学习与数据挖掘核心技术。

内容简介

本书以项目实践作为主线,结合必需的理论知识,以任务的形式进行内容设计,每个任务都包含任务描述及任务实施的步骤,读者按照实施步骤进行操作就可以完成相应的学习任务,从而不断提升项目实践能力。

本书主要内容涉及机器学习的基础知识,模型评估与选择,回归、分类、聚类等机器学习算法,数据挖掘的基础知识,数据分析与应用,以及通过用户行为分析预测项目学习如何将机器学习与数据挖掘应用到实际中。

目录

  • 版权信息
  • 内容提要
  • 前言
  • 写作背景
  • 本书读者对象
  • 本书主要内容
  • 勘误和支持
  • 资源与支持
  • 资源获取
  • 提交勘误
  • 与我们联系
  • 关于异步社区和异步图书
  • 项目1 初识机器学习
  • 任务1 学习机器学习的理论
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 人工智能
  • 【任务实施】
  • 1.机器学习的发展历程
  • 2.机器学习的概念
  • 3.机器学习的方法
  • 4.机器学习的三要素
  • 5.机器学习的应用
  • 任务2 软件的安装与使用
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.Python
  • 2.PyCharm
  • 【任务实施】
  • 1.安装PyCharm软件
  • 2.安装Python软件
  • 3.配置PyCharm环境
  • 项目小结
  • 思考与练习
  • 理论题
  • 一、选择题
  • 二、填空题
  • 三、简答题
  • 实训题
  • 项目2 模型评估与选择
  • 任务1 学习过拟合与欠拟合
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.过拟合与欠拟合原理
  • 2.欠拟合
  • 3.过拟合
  • 【任务实施】
  • 任务2 学习评估方法
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.留出法
  • 2.交叉验证法
  • 3.自助法
  • 【任务实施】
  • 1.留出法的Python代码实现
  • 2.交叉验证法的Python代码实现
  • 3.自助法的Python代码实现
  • 任务3 学习性能度量与检验
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.错误率与精度
  • 2.查准率、查全率与F1
  • 3.ROC和AUC
  • 4.代价敏感错误率与代价曲线
  • 5.比较检验
  • 【任务实施】
  • 项目小结
  • 1.过拟合与欠拟合
  • 2.两种误差
  • 3.评估方法(或者说是测试集的选取方法)
  • 4.性能度量
  • 项目拓展
  • 超参数调优的方法
  • 思考与练习
  • 理论题
  • 一、选择题
  • 二、填空题
  • 三、简答题
  • 实训题
  • 项目3 回归算法与应用
  • 任务1 学习回归预测问题
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 【任务实施】
  • 1.回归分析预测法的概念
  • 2.回归分析预测法的分类
  • 3.应用回归预测法时应注意的问题
  • 4.回归分析预测法的步骤
  • 任务2 学习线性回归
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.微分
  • 2.梯度
  • 3.学习率
  • 4.线性回归算法的优缺点
  • 5.应用实例
  • 【任务实施】
  • 1.线性回归的概念
  • 2.线性回归解决什么问题
  • 3.损失函数
  • 4.梯度下降
  • 任务3 学习Lasso回归
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 【任务实施】
  • 任务4 学习神经网络
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 【任务实施】
  • 1.神经网络的基本概念
  • 2.神经网络的基本特征
  • 3.神经网络的基本构成
  • 任务5 学习逻辑斯谛回归
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.分布函数和密度函数
  • 2.似然函数
  • 3.极大似然估计
  • 【任务实施】
  • 1.逻辑斯谛回归的基本概念
  • 2.逻辑斯谛回归的一般过程
  • 3.模型训练与代价函数
  • 4.代价函数与参数最优解
  • 项目小结
  • 项目拓展
  • 思考与练习
  • 理论题
  • 一、选择题
  • 二、简答题
  • 实训题
  • 项目4 分类算法与应用
  • 任务1 学习分类问题
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 【任务实施】
  • 1.分类的基本概念和过程描述
  • 2.分类模型常见的构造方法
  • 3.解决分类问题的方法
  • 任务2 学习支持向量机
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.支持向量机
  • 2.支持向量机的优点
  • 3.支持向量机的缺点
  • 【任务实施】
  • 支持向量机算法原理
  • 任务3 学习朴素贝叶斯分类
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.朴素贝叶斯算法
  • 2.朴素贝叶斯算法的优点
  • 3.朴素贝叶斯算法的缺点
  • 4.朴素贝叶斯算法的应用
  • 【任务实施】
  • 1.朴素贝叶斯的算法原理
  • 2.需要注意的问题
  • 任务4 学习kNN算法
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.kNN算法的优点
  • 2.kNN算法的缺点
  • 【任务实施】
  • 1.kNN算法描述
  • 2.k值的选择
  • 3.距离的度量
  • 4.kNN算法示例
  • 任务5 学习决策树
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.决策树
  • 2.决策过程
  • 3.决策树特征选择
  • 4.信息熵
  • 5.信息增益
  • 6.信息增益比
  • 7.基尼指数
  • 8.决策树的优点
  • 9.决策树的缺点
  • 【任务实施】
  • 项目小结
  • 项目拓展
  • 思考与练习
  • 理论题
  • 一、选择题
  • 二、填空题
  • 实训题
  • 项目5 聚类算法与应用
  • 任务1 学习聚类问题
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 【任务实施】
  • 1.聚类和分类的区别
  • 2.聚类的一般过程
  • 3.生活中的聚类问题
  • 任务2 学习K-means聚类
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.K-means聚类的概念
  • 2.K-means聚类的优点
  • 3.K-means聚类的缺点
  • 【任务实施】
  • 任务3 学习密度聚类
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.密度聚类的基本概念
  • 2.密度聚类的主要特点
  • 3.密度聚类的优点
  • 4.密度聚类的缺点
  • 【任务实施】
  • 任务4 学习层次聚类
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.层次聚类的基本概念
  • 2.层次聚类算法的优点
  • 3.层次聚类算法的缺点
  • 【任务实施】
  • 通过自底向上合并的方法构造一棵树
  • 任务5 学习主成分分析
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.主成分分析的基本概念
  • 2.主成分分析算法的优点
  • 3.主成分分析算法的缺点
  • 4.主成分分析算法的应用领域
  • 【任务实施】
  • 1.主成分分析的原理
  • 2.主成分分析的计算步骤
  • 任务6 进行聚类效果评测
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.内部质量评价标准
  • 2.外部质量评价标准
  • 【任务实施】
  • 1.误差平方和
  • 2.轮廓系数
  • 3.CH指数
  • 4.戴维森堡丁指数
  • 项目小结
  • 项目拓展
  • 思考与练习
  • 理论题
  • 一、选择题
  • 二、简答题
  • 实训题
  • 项目6 机器学习应用
  • 任务1 学习MNIST数字分类
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.手写数字识别
  • 2.MNIST数据集
  • 【任务实施】
  • 1.导入库并加载数据集
  • 2.预处理数据
  • 3.创建模型
  • 4.训练模型
  • 5.评估模型
  • 6.创建GUI来预测数字
  • 任务2 学习泰坦尼克号生存计划
  • 【任务描述】
  • 【任务目标】
  • 【任务实施】
  • 1.导入相关包和模块
  • 2.数据理解和探索
  • 3.数据准备
  • 4.构建模型
  • 5.模型评估
  • 6.预测新数据
  • 任务3 进行房价预测
  • 【任务描述】
  • 【任务目标】
  • 【任务实施】
  • 1.数据准备
  • 2.数据预处理
  • 3.数据分析
  • 4.模型建立与预测
  • 项目小结
  • 项目拓展
  • 思考与练习
  • 理论题
  • 一、填空题
  • 二、判断题
  • 实训题
  • 项目7 数据挖掘
  • 任务1 学习数据挖掘的概念
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 【任务实施】
  • 1.数据挖掘的步骤
  • 2.数据挖掘的对象
  • 任务2 学习数据挖掘的应用
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.金融公司、银行等金融领域
  • 2.医疗保健和保险领域
  • 3.交通运输领域
  • 4.医学领域
  • 5.教育领域
  • 6.制造工程领域
  • 【任务实施】
  • 任务3 学习数据挖掘的模型
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.监督式学习模型
  • 2.无监督学习模型
  • 【任务实施】
  • 1.线性回归
  • 2.多项式回归
  • 3.岭回归
  • 4.随机森林
  • 5.多层神经网络
  • 项目小结
  • 项目拓展
  • 思考与练习
  • 理论题
  • 一、填空题
  • 二、判断题
  • 实训题
  • 项目8 数据分析与应用
  • 任务1 学习数据分析的概念
  • 【任务描述】
  • 【任务目标】
  • 【任务实施】
  • 1.数据分析的概念
  • 2.数据分析的步骤
  • 3.数据分析的目的
  • 4.数据分析的应用领域
  • 任务2 学习关联规则算法及应用
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 1.关联规则
  • 2.关联规则算法的一般步骤
  • 3.关联规则算法的应用范围
  • 【任务实施】
  • 任务3 进行银行信贷预测
  • 【任务描述】
  • 【任务目标】
  • 【任务实施】
  • 任务4 使用WEKA软件进行房屋定价
  • 【任务描述】
  • 【任务目标】
  • 【知识链接】
  • 【任务实施】
  • 1.WEKA软件的下载与安装
  • 2.WEKA软件的使用
  • 3.房屋定价案例分析
  • 项目小结
  • 项目拓展
  • 思考与练习
  • 理论题
  • 一、填空题
  • 二、选择题
  • 实训题
  • 项目9 淘宝用户行为分析预测
  • 【项目描述】
  • 【项目目标】
  • 【知识链接】
  • 1.数据集
  • 2.数据集的内容
  • 3.用户行为类型
  • 【项目实施】
  • 项目小结
  • 项目拓展
  • 思考与练习
  • 实训题
  • 参考文献
展开全部

评分及书评

评分不足
1个评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。