互联网
类型
可以朗读
语音朗读
108千字
字数
2023-10-01
发行日期
展开全部
主编推荐语
详解数据挖掘技术的理论知识与R语言的实战应用。
内容简介
本书首先介绍了R语言的相关知识,包括R语言基础、R语言可视化技术。随后本书详细介绍了数据挖掘与数据分析中重要的理论方法与基础知识,包括线性回归、逻辑回归、决策树与回归树、随机森林、贝叶斯分类器等内容,并展示了如何将R语言用到这些方法的具体场景中。
目录
- 版权信息
- 前言
- 第1章 R语言基础
- 学习目标
- 应用背景介绍
- 1.1 R语言中的数据读取和数据导出
- 1.1.1 第一个R会话
- 1.1.2 变量赋值
- 1.1.3 从文件中读取数据
- 1.1.4 从R语言的包中获取数据
- 1.1.5 导出数据
- 1.2 R语言中的数据类型和对象
- 1.2.1 数据类型
- 1.2.2 R语言中的向量
- 1.2.3 R语言中的矩阵
- 1.2.4 R语言中的数据框
- 1.2.5 R语言中的列表
- 1.2.6 R语言中的因子
- 1.3 R语言中的控制语句及函数
- 1.3.1 if分支
- 1.3.2 for循环
- 1.3.3 while循环
- 1.3.4 switch语句
- 1.3.5 自定义函数
- 1.3.6 R语言中的内置函数
- 1.4 R语言中的数据处理
- 1.4.1 从数据集中提取信息
- 1.4.2 缺失信息处理
- 1.4.3 运算符
- 1.4.4 替换现有字段中的数据
- 1.4.5 变量的重命名
- 1.4.6 数字的四舍五入
- 1.4.7 子集数据
- 1.4.8 随机抽样
- 1.4.9 apply()函数集合
- 1.4.10 数据类型转换
- 1.4.11 数据聚合
- 1.4.12 文本数据排序
- 1.4.13 数据合并
- 1.4.14 table()函数
- 1.5 R包
- 1.5.1 dplyr包
- 1.5.2 tidyr包
- 本章小结
- 课后习题
- 第2章 R语言可视化技术
- 学习目标
- 应用背景介绍
- 2.1 ggplot2的图层语法
- 2.1.1 图像的组成
- 2.1.2 散点图示例
- 2.2 图层
- 2.2.1 绘图对象
- 2.2.2 几何对象
- 2.2.3 统计变换
- 2.2.4 位置调整
- 2.3 图像细节调整
- 2.3.1 标度
- 2.3.2 坐标系
- 2.3.3 分面
- 2.3.4 主题
- 2.4 常用工具图的绘制
- 2.4.1 条形图与直方图
- 2.4.2 折线图与路线图
- 2.4.3 饼图
- 2.4.4 箱线图与小提琴图
- 2.4.5 QQ图
- 本章小结
- 课后习题
- 第3章 线性回归
- 学习目标
- 应用背景介绍
- 3.1 线性回归模型的基本形式
- 3.2 线性回归模型参数的估计
- 3.3 自变量为分类变量的处理
- 3.4 线性回归模型的显著性检验
- 3.5 线性回归中的多重共线性
- 3.6 线性回归模型的拟合优度
- 3.7 回归诊断
- 3.7.1 异常点识别
- 3.7.2 线性关系检验
- 3.7.3 残差的正态性检验
- 3.8 线性回归的R语言实现
- 本章小结
- 课后习题
- 第4章 逻辑回归
- 学习目标
- 应用背景介绍
- 4.1 逻辑回归原理
- 4.1.1 逻辑回归模型简介
- 4.1.2 逻辑回归函数
- 4.1.3 逻辑回归推导
- 4.2 逻辑回归算法示例
- 4.3 模型理解
- 4.4 R语言编程
- 4.4.1 数据导入
- 4.4.2 数据预处理
- 4.4.3 逻辑回归模型训练
- 4.4.4 逻辑回归模型验证
- 本章小结
- 课后习题
- 第5章 决策树与回归树
- 学习目标
- 应用背景介绍
- 5.1 CART算法原理
- 5.1.1 决策树生成
- 5.1.2 决策树剪枝
- 5.2 CART算法示例
- 5.3 模型理解
- 5.3.1 决策树模型的优缺点
- 5.3.2 决策树模型实践建议
- 5.3.3 连续属性离散化
- 5.4 R语言编程
- 5.4.1 数据导入
- 5.4.2 数据预处理
- 5.4.3 决策树模型训练
- 5.4.4 决策树模型验证
- 本章小结
- 课后习题
- 第6章 随机森林
- 学习目标
- 应用背景介绍
- 6.1 随机森林方法原理
- 6.1.1 bagging介绍
- 6.1.2 随机森林介绍
- 6.2 模型理解
- 6.2.1 随机森林模型的优缺点
- 6.2.2 随机森林模型应用
- 6.3 R语言编程
- 6.3.1 数据导入
- 6.3.2 数据预处理
- 6.3.3 随机森林模型训练
- 6.3.4 随机森林模型验证
- 本章小结
- 课后习题
- 第7章 贝叶斯分类器
- 学习目标
- 应用背景介绍
- 7.1 贝叶斯定理
- 7.2 朴素贝叶斯分类器
- 7.2.1 朴素贝叶斯分类器的工作流程
- 7.2.2 估计类别下属性划分的条件概率
- 7.2.3 Laplace校准
- 7.2.4 朴素贝叶斯分类器的特征
- 7.3 贝叶斯信念网络
- 7.3.1 模型表示
- 7.3.2 构建BBN模型
- 7.3.3 BBN案例分析
- 7.3.4 贝叶斯网络的特征
- 7.4 R语言编程
- 7.4.1 朴素贝叶斯分类器应用实例
- 7.4.2 贝叶斯网络应用示例
- 本章小结
- 课后习题
- 第8章 层次聚类
- 学习目标
- 应用背景介绍
- 8.1 算法原理
- 8.1.1 凝聚层次聚类
- 8.1.2 分裂层次聚类
- 8.2 算法示例
- 8.3 模型理解
- 8.3.1 层次聚类的优缺点
- 8.3.2 距离度量的选择
- 8.4 R语言编程
- 8.4.1 数据导入
- 8.4.2 数据预处理
- 8.4.3 聚类分组
- 8.4.4 结果分析
- 本章小结
- 课后习题
- 第9章 K均值聚类
- 学习目标
- 应用背景介绍
- 9.1 算法原理
- 9.1.1 算法步骤
- 9.1.2 最优K值选择
- 9.1.3 距离度量
- 9.1.4 K均值聚类算法延伸
- 9.2 算法示例
- 9.3 模型理解
- 9.4 R语言编程
- 9.4.1 数据导入
- 9.4.2 数据预处理
- 9.4.3 确定最佳K值
- 9.4.4 聚类及可视化
- 本章小结
- 课后习题
- 第10章 关联规则分析
- 学习目标
- 应用背景介绍
- 10.1 关联分析与概率统计
- 10.2 关联规则的挖掘
- 10.2.1 关联规则的基本概念
- 10.2.2 关联规则的挖掘
- 10.3 Apriori算法原理
- 10.3.1 Apriori算法的基本框架
- 10.3.2 Fk-1×Fk-1方法
- 10.3.3 Fk-1×Fk-1方法的备用方式
- 10.3.4 规则生成
- 10.4 R语言编程
- 10.4.1 数据导入
- 10.4.2 数据预处理
- 10.4.3 Apriori算法建模
- 10.4.4 结果分析
- 10.4.5 疾病数据分析
- 本章小结
- 课后习题
- 第11章 案例分析之随机森林
- 学习目标
- 案例背景
- 11.1 案例介绍
- 11.2 描述分析
- 11.3 模型构建
- 11.4 结果分析
- 本章小结
- 第12章 案例分析之K均值聚类
- 学习目标
- 案例背景
- 12.1 案例介绍
- 12.2 客户细分变量提取
- 12.2.1 客户意愿细分变量
- 12.2.2 客户价值细分变量
- 12.3 数据收集
- 12.3.1 客户意愿数据
- 12.3.2 客户价值数据
- 12.4 数据预处理
- 12.4.1 数据清洗与整理
- 12.4.2 离群值处理
- 12.4.3 标准化处理
- 12.4.4 One-Hot编码
- 12.4.5 Binary编码
- 12.5 K均值聚类
- 12.5.1 K值确定
- 12.5.2 聚类及可视化
- 12.6 对策与建议
- 本章小结
- 参考文献
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。