计算机
类型
可以朗读
语音朗读
285千字
字数
2020-04-01
发行日期
展开全部
主编推荐语
本书14章涉及Hadoop概述、生态组件、大数据实战项目。
内容简介
本书共14章,前4章主要讲解和演示大数据与Hadoop概述、Hadoop伪分布式安装、HDFS分布式文件系统、MapReduce分布式计算框架。第5到11章讲解了Hadoop生态的常用组件,包括NoSQL数据库HBase、分布式数据仓库Hive、数据转换工具Sqoop、内存计算框架Spark。最后3章讲解了3个企业级的大型大数据综合实战项目。
目录
- 版权信息
- 内容提要
- 前言
- 本书有何特色
- 适合阅读本书的读者
- 第一篇 Hadoop技术
- 第1章 大数据与Hadoop概述
- 1.1 大数据概述
- 1.2 Hadoop概述
- 1.3 小结
- 1.4 配套视频
- 第2章 Hadoop伪分布式安装
- 2.1 Hadoop伪分布式安装前的准备
- 2.2 Hadoop伪分布式安装
- 2.3 Hadoop验证
- 2.4 小结
- 2.5 配套视频
- 第3章 Hadoop分布式文件系统
- 3.1 HDFS原理
- 3.2 HDFS Shell
- 3.3 HDFS Java API
- 3.4 小结
- 3.5 配套视频
- 第4章 分布式计算框架MapReduce
- 4.1 MapReduce原理
- 4.2 MapReduce编程基础
- 4.3 MapReduce综合实例
- 4.4 MapReduce综合实例
- 4.5 MapReduce综合实例
- 4.6 MapReduce综合实例
- 4.7 小结
- 4.8 配套视频
- 第二篇 Hadoop生态系统的主要大数据工具整合应用
- 第5章 NoSQL数据库HBase
- 5.1 HBase原理
- 5.2 HBase伪分布式安装
- 5.3 HBase Shell
- 5.4 小结
- 5.5 配套视频
- 第6章 HBase高级特性
- 6.1 HBase Java API
- 6.2 HBase与MapReduce的整合
- 6.3 小结
- 6.4 配套视频
- 第7章 分布式数据仓库Hive
- 7.1 Hive概述
- 7.2 Hive伪分布式安装
- 7.3 Hive QL的基础功能
- 7.4 Hive QL的高级功能
- 7.5 小结
- 7.6 配套视频
- 第8章 Hive高级特性
- 8.1 Beeline
- 8.2 Hive JDBC
- 8.3 Hive函数
- 8.4 Hive表的高级特性
- 8.5 小结
- 8.6 配套视频
- 第9章 数据转换工具Sqoop
- 9.1 Sqoop概述与安装
- 9.2 Sqoop导入数据
- 9.3 Sqoop导出数据
- 9.4 深入理解Sqoop的导入与导出
- 9.5 小结
- 9.6 配套视频
- 第10章 内存计算框架Spark
- 10.1 Spark入门
- 10.2 Spark Streaming
- 10.3 Spark SQL
- 10.4 小结
- 10.5 配套视频
- 第11章 Hadoop及其常用组件集群安装
- 11.1 Hadoop集群安装
- 11.2 HBase集群安装
- 11.3 Hive集群安装
- 11.4 Spark集群安装
- 11.5 小结
- 11.6 配套视频
- 第三篇 实战篇
- 第12章 海量Web日志分析系统
- 12.1 案例介绍
- 12.2 案例分析
- 12.3 案例实现
- 12.4 小结
- 12.5 配套视频
- 第13章 电商商品推荐系统
- 13.1 案例介绍
- 13.2 案例设计
- 13.3 案例实现
- 13.4 小结
- 13.5 配套视频
- 第14章 分布式垃圾消息识别系统
- 14.1 案例介绍
- 14.2 RPC远程方法调用的设计
- 14.3 数据分析设计
- 14.4 案例实现
- 14.5 小结
- 14.6 配套视频
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。