4.2 用户推荐指数
互联网
类型
可以朗读
语音朗读
343千字
字数
2021-01-01
发行日期
展开全部
主编推荐语
本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。
内容简介
全书共17章,内容包含大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、数据仓库Hive、Spark、流计算、Flink、图计算、数据可视化以及大数据在互联网、生物医学领域和其他行业的应用。本书在Hadoop、HDFS、HBase、MapReduce、Hive、Spark和Flink等重要章节安排了入门级的实践操作,以便读者更好地学习和掌握大数据关键技术。
目录
- 版权信息
- 内容提要
- 前言(第3版)
- 第一篇 大数据基础
- 第1章 大数据概述
- 1.1 大数据时代
- 1.2 大数据的概念
- 1.3 大数据的影响
- 1.4 大数据的应用
- 1.5 大数据关键技术
- 1.6 大数据计算模式
- 1.7 大数据产业
- 1.8 大数据与云计算、物联网
- 1.9 本章小结
- 1.10 习题
- 第2章 大数据处理架构Hadoop
- 2.1 概述
- 2.2 Hadoop生态系统
- 2.3 Hadoop的安装与使用
- 2.4 本章小结
- 2.5 习题
- 实验1 熟悉常用的Linux操作和Hadoop操作
- 第二篇 大数据存储与管理
- 第3章 分布式文件系统HDFS
- 3.1 分布式文件系统
- 3.2 HDFS简介
- 3.3 HDFS的相关概念
- 3.4 HDFS体系结构
- 3.5 HDFS的存储原理
- 3.6 HDFS的数据读写过程
- 3.7 HDFS编程实践
- 3.8 本章小结
- 3.9 习题
- 实验2 熟悉常用的HDFS操作
- 第4章 分布式数据库HBase
- 4.1 概述
- 4.2 HBase访问接口
- 4.3 HBase数据模型
- 4.4 HBase的实现原理
- 4.5 HBase运行机制
- 4.6 HBase编程实践
- 4.7 本章小结
- 4.8 习题
- 实验3 熟悉常用的HBase操作
- 第5章 NoSQL数据库
- 5.1 NoSQL简介
- 5.2 NoSQL兴起的原因
- 5.3 NoSQL与关系数据库的比较
- 5.4 NoSQL的四大类型
- 5.5 NoSQL的三大基石
- 5.6 从NoSQL到NewSQL数据库
- 5.7 本章小结
- 5.8 习题
- 实验4 NoSQL和关系数据库的操作比较
- 第6章 云数据库
- 6.1 云数据库概述
- 6.2 云数据库产品
- 6.3 云数据库系统架构
- 6.4 本章小结
- 6.5 习题
- 第三篇 大数据处理与分析
- 第7章 MapReduce
- 7.1 概述
- 7.2 MapReduce的工作流程
- 7.3 实例分析:WordCount
- 7.4 MapReduce的具体应用
- 7.5 MapReduce编程实践
- 7.6 本章小结
- 7.7 习题
- 实验5 MapReduce初级编程实践
- 第8章 Hadoop再探讨
- 8.1 Hadoop的优化与发展
- 8.2 HDFS 2.0的新特性
- 8.3 新一代资源管理调度框架YARN
- 8.4 Hadoop生态系统中具有代表性的功能组件
- 8.5 本章小结
- 8.6 习题
- 第9章 数据仓库Hive
- 9.1 概述
- 9.2 Hive系统架构
- 9.3 Hive工作原理
- 9.4 Hive HA基本原理
- 9.5 Impala
- 9.6 Hive编程实践
- 9.7 本章小结
- 9.8 习题
- 实验6 熟悉Hive的基本操作
- 第10章 Spark
- 10.1 概述
- 10.2 Spark生态系统
- 10.3 Spark运行架构
- 10.4 Spark的部署和应用方式
- 10.5 Spark编程实践
- 10.6 本章小结
- 10.7 习题
- 实验7 Spark初级编程实践
- 第11章 流计算
- 11.1 流计算概述
- 11.2 流计算的处理流程
- 11.3 流计算的应用
- 11.4 开源流计算框架Storm
- 11.5 Spark Streaming
- 11.6 本章小结
- 11.7 习题
- 第12章 Flink
- 12.1 Flink简介
- 12.2 为什么选择Flink
- 12.3 Flink应用场景
- 12.4 Flink技术栈
- 12.5 Flink体系架构
- 12.6 Flink编程模型
- 12.7 Flink编程实践
- 12.8 本章小结
- 12.9 习题
- 实验8 Flink初级编程实践
- 第13章 图计算
- 13.1 图计算简介
- 13.2 Pregel简介
- 13.3 Pregel图计算模型
- 13.4 Pregel的C++ API
- 13.5 Pregel的体系结构
- 13.6 Pregel的应用实例
- 13.7 Pregel和MapReduce实现PageRank算法的对比
- 13.8 本章小结
- 13.9 习题
- 第14章 数据可视化
- 14.1 可视化概述
- 14.2 可视化工具
- 14.3 可视化典型案例
- 14.4 本章小结
- 14.5 习题
- 第四篇 大数据应用
- 第15章 大数据在互联网领域的应用
- 15.1 推荐系统概述
- 15.2 协同过滤
- 15.3 协同过滤实践
- 15.4 本章小结
- 15.5 习题
- 第16章 大数据在生物医学领域的应用
- 16.1 流行病预测
- 16.2 智慧医疗
- 16.3 生物信息学
- 16.4 案例:基于大数据的综合健康服务平台
- 16.5 本章小结
- 16.6 习题
- 第17章 大数据的其他应用
- 17.1 大数据在物流领域中的应用
- 17.2 大数据在城市管理中的应用
- 17.3 大数据在金融行业中的应用
- 17.4 大数据在汽车行业中的应用
- 17.5 大数据在零售行业中的应用
- 17.6 大数据在餐饮行业中的应用
- 17.7 大数据在电信行业中的应用
- 17.8 大数据在能源行业中的应用
- 17.9 大数据在体育和娱乐领域中的应用
- 17.10 大数据在安全领域中的应用
- 17.11 大数据在政府领域中的应用
- 17.12 大数据在日常生活中的应用
- 17.13 本章小结
- 17.14 习题
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。