互联网
类型
可以朗读
语音朗读
229千字
字数
2018-08-01
发行日期
展开全部
主编推荐语
数据科学与大数据技术专业系列规划教材。强调概念+算法实践,让你“小数据”上会“算”,“大数据”上“算得快”。
内容简介
《大数据分析与挖掘》主要内容包括:第1章绪论、第2章数据特征分析与预处理、第3章关联规则挖掘、第4章分类算法、第5章聚类算法、第6章分布式大数据流挖掘、第7章综合案例——基于华为技术与设备。
本书可作为高等院校数据科学与大数据技术、计算机科学与技术等相关专业的本科生教材。
目录
- 版权信息
- 内容提要
- 编委会
- 丛书序一
- 丛书序二
- 前言
- 第1章 绪论
- 1.1 大数据分析与挖掘简介
- 1.2 大数据应用及挑战
- 1.3 大数据分析与挖掘主要技术
- 1.4 大数据分析与挖掘工具
- 第2章 数据特征分析与预处理
- 2.1 数据类型
- 2.2 数据的描述性特征
- 2.3 数据的相关分析
- 2.4 数据预处理
- 2.5 Spark数据预处理功能简介
- 习题
- 第3章 关联规则挖掘
- 3.1 基本概念
- 3.2 基于候选项产生—测试策略的频繁模式挖掘算法
- 3.3 不需要产生候选项集的频繁模式挖掘算法
- 3.4 结合相关性分析的关联规则
- 3.5 多层关联规则挖掘算法
- 3.6 序列模式挖掘
- 3.7 其他类型关联规则简介
- 习题
- 第4章 分类与回归算法
- 4.1 决策树算法
- 4.2 贝叶斯分类器
- 4.3 基于实例的分类算法
- 4.4 组合分类算法
- 4.5 分类器算法的评估
- 4.6 回归分析
- 习题
- 第5章 聚类算法
- 5.1 聚类分析概述
- 5.2 聚类算法的分类
- 5.3 距离度量
- 5.4 基于划分的聚类算法
- 5.5 基于密度的聚类算法
- 5.6 基于模型的聚类算法:高斯混合模型算法
- 5.7 层次聚类
- 5.8 基于网格的聚类算法
- 5.9 Mean Shift聚类算法
- 5.10 聚类算法评价指标
- 习题
- 第6章 数据挖掘综合应用:异常检测
- 6.1 预备知识
- 6.2 基于隔离森林的异常检测算法
- 6.3 局部异常因子算法
- 6.4 基于One-Class SVM的异常检测算法
- 6.5 基于主成分分析的异常检测算法
- 6.6 基于集成学习的异常检测算法
- 6.7 其他有监督学习类型的检测算法
- 6.8 习题
- 附录 《大数据分析与挖掘》配套实验课程方案简介
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。