科技
类型
可以朗读
语音朗读
183千字
字数
2023-07-01
发行日期
展开全部
主编推荐语
本书系统介绍了大数据的基本原理与概念。
内容简介
全书共9章,分别讲解大数据的基本知识、大数据与新一代信息技术、数据采集、大数据存储、数据清洗、大数据分析与挖掘、数据可视化、大数据安全与治理以及大数据的应用。
本书系统介绍了大数据的基础知识,并对一些大数据的应用实例进行讲解。本书可作为高等院校大数据专业、人工智能专业、软件技术专业、云计算专业、计算机网络专业的专业基础课教材,也可作为大数据爱好者的参考书。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 大数据的基本知识
- 1.1 大数据概述
- 1.1.1 大数据的特征
- 1.1.2 大数据的意义
- 1.2 大数据的数据类型
- 1.2.1 结构化数据
- 1.2.2 非结构化数据
- 1.2.3 结构化数据和非结构化数据的区别
- 1.3 大数据政策
- 1.3.1 国外的大数据政策
- 1.3.2 国内的大数据政策
- 1.4 小结
- 1.5 习题
- 第2章 大数据与新一代信息技术
- 2.1 大数据与云计算
- 2.1.1 云计算概述
- 2.1.2 大数据与云计算的区别与联系
- 2.2 大数据与物联网
- 2.2.1 物联网概述
- 2.2.2 大数据与物联网的区别与联系
- 2.3 大数据与人工智能
- 2.3.1 人工智能概述
- 2.3.2 大数据与人工智能的区别与联系
- 2.4 大数据与区块链
- 2.4.1 区块链概述
- 2.4.2 大数据与区块链的区别与联系
- 2.5 小结
- 2.6 习题
- 第3章 数据采集
- 3.1 数据采集概述
- 3.1.1 认识数据采集
- 3.1.2 数据采集的常见方式
- 3.2 数据采集平台
- 3.2.1 Flume
- 3.2.2 Kafka
- 3.2.3 Logstash
- 3.3 网络爬虫
- 3.3.1 认识网络爬虫
- 3.3.2 网络爬虫的分类及特点
- 3.3.3 网络爬虫的道德规范与法律风险
- 3.4 小结
- 3.5 习题
- 第4章 大数据存储
- 4.1 大数据存储概述
- 4.1.1 大数据存储的概念
- 4.1.2 大数据存储的分类
- 4.2 Hadoop架构
- 4.2.1 认识Hadoop架构
- 4.2.2 Hadoop的起源与发展
- 4.2.3 Hadoop生态组件
- 4.3 NoSQL数据库
- 4.3.1 认识NoSQL数据库
- 4.3.2 NoSQL数据库的分类
- 4.4 数据仓库
- 4.4.1 认识数据仓库
- 4.4.2 数据仓库的特点
- 4.4.3 数据仓库的应用
- 4.5 小结
- 4.6 习题
- 第5章 数据清洗
- 5.1 数据清洗概述
- 5.1.1 认识数据清洗
- 5.1.2 数据清洗的流程
- 5.1.3 数据质量
- 5.2 数据清洗的方法
- 5.2.1 处理缺失值
- 5.2.2 处理异常值
- 5.2.3 处理重复值
- 5.3 数据清洗的常用工具
- 5.3.1 Python
- 5.3.2 R
- 5.3.3 Kettle
- 5.3.4 DataCleaner
- 5.4 小结
- 5.5 习题
- 第6章 大数据分析与挖掘
- 6.1 大数据分析概述
- 6.1.1 大数据分析的概念
- 6.1.2 大数据分析的常用方法
- 6.2 数据挖掘
- 6.2.1 认识数据挖掘
- 6.2.2 数据挖掘的应用
- 6.3 数据挖掘的常见算法
- 6.3.1 K-Means算法
- 6.3.2 KNN算法
- 6.3.3 朴素贝叶斯算法
- 6.3.4 决策树算法
- 6.3.5 支持向量机算法
- 6.4 小结
- 6.5 习题
- 第7章 数据可视化
- 7.1 数据可视化概述
- 7.1.1 认识数据可视化
- 7.1.2 数据可视化的类型
- 7.2 数据可视化的方法
- 7.2.1 文本可视化
- 7.2.2 社交网络可视化
- 7.2.3 地理空间可视化
- 7.3 数据可视化的常见工具
- 7.3.1 ECharts
- 7.3.2 Excel
- 7.3.3 D3
- 7.3.4 Tableau
- 7.4 小结
- 7.5 习题
- 第8章 大数据安全与治理
- 8.1 大数据安全概述
- 8.1.1 认识数据安全
- 8.1.2 大数据面临的安全挑战
- 8.1.3 大数据安全的关键技术
- 8.2 数据治理
- 8.2.1 认识数据治理
- 8.2.2 数据治理的目标
- 8.2.3 数据治理的实现
- 8.3 小结
- 8.4 习题
- 第9章 大数据的应用
- 9.1 农业大数据
- 9.1.1 认识农业大数据
- 9.1.2 农业大数据的关键技术
- 9.1.3 农业大数据的应用
- 9.2 工业大数据
- 9.2.1 认识工业大数据
- 9.2.2 工业大数据的关键技术
- 9.2.3 工业大数据的应用
- 9.3 金融大数据
- 9.3.1 认识金融大数据
- 9.3.2 金融大数据的关键技术
- 9.3.3 金融大数据的应用
- 9.4 交通大数据
- 9.4.1 认识交通大数据
- 9.4.2 交通大数据的关键因素
- 9.4.3 交通大数据的应用
- 9.5 小结
- 9.6 习题
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。