科技
类型
可以朗读
语音朗读
327千字
字数
2022-07-01
发行日期
展开全部
主编推荐语
本书详解了Hadoop全栈技术及其大数据挖掘方法。
内容简介
本书基于开源Hadoop生态圈的主流技术,深入浅出地介绍了大数据相关技术的原理、知识点及具体应用,适合教师教学使用和零基础自学者使用。
通过本书的学习,读者可以理解大数据相关技术的原理,迅速掌握大数据技术的操作,为后续数据挖掘与分布式计算平台的结合使用打下良好的技术基础。
目录
- 版权信息
- 作者介绍
- 前言
- 第一部分 基础篇
- 第1章 浅谈大数据
- 1.1 大数据产生的背景
- 1.2 大数据概述
- 1.3 大数据挖掘概述
- 1.4 大数据平台
- 1.5 小结
- 第2章 大数据基础架构Hadoop
- 2.1 Hadoop技术概述
- 2.2 Hadoop应用场景介绍
- 2.3 Hadoop生态系统
- 2.4 Hadoop安装配置
- 2.5 Hadoop HDFS文件操作命令
- 2.6 Hadoop MapReduce编程开发
- 2.7 场景应用:电影网站用户影评分析
- 2.8 小结
- 第3章 数据仓库Hive
- 3.1 Hive技术概述
- 3.2 Hive应用场景介绍
- 3.3 Hive安装配置
- 3.4 HiveQL查询语句
- 3.5 Hive自定义函数的使用
- 3.6 场景应用:基站掉话率排名统计
- 3.7 小结
- 第4章 分布式协调框架ZooKeeper
- 4.1 ZooKeeper技术概述
- 4.2 ZooKeeper应用场景介绍
- 4.3 ZooKeeper分布式安装配置
- 4.4 ZooKeeper客户端常用命令
- 4.5 ZooKeeper Java API操作
- 4.6 场景应用:服务器上下线动态监控
- 4.7 小结
- 第5章 分布式数据库HBase
- 5.1 HBase技术概述
- 5.2 HBase应用场景介绍
- 5.3 HBase安装配置
- 5.4 HBase Shell操作
- 5.5 HBase高级应用
- 5.6 场景应用:用户通话记录数据存储设计及查询
- 5.7 小结
- 第6章 分布式计算框架Spark
- 6.1 Spark技术概述
- 6.2 Spark应用场景介绍
- 6.3 Spark集群安装配置
- 6.4 Spark Core——底层基础框架
- 6.5 Spark SQL——查询引擎框架
- 6.6 Spark MLlib——机器学习库
- 6.7 Spark Streaming——流计算框架
- 6.8 小结
- 第7章 大数据采集框架Flume
- 7.1 Flume技术概述
- 7.2 Flume应用场景介绍
- 7.3 Flume安装与配置
- 7.4 Flume核心组件的常见类型及参数配置
- 7.5 Flume采集方案设计与实践
- 7.6 场景应用:广告日志数据采集系统
- 7.7 小结
- 第8章 消息订阅系统Kafka
- 8.1 Kafka技术概述
- 8.2 Kafka应用场景介绍
- 8.3 Kafka集群的安装
- 8.4 Kafka的基础操作
- 8.5 Kafka Java API的使用
- 8.6 场景应用:广告日志数据实时传输
- 8.7 小结
- 第二部分 实战篇
- 第9章 图书热度实时分析系统
- 9.1 背景与目标
- 9.2 创建IDEA项目并添加依赖
- 9.3 图书数据采集
- 9.4 图书热度指标构建
- 9.5 图书热度实时计算
- 9.6 图书热度实时分析过程的完整实现
- 9.7 小结
- 第10章 O2O优惠券个性化投放
- 10.1 背景与目标
- 10.2 数据探索及预处理
- 10.3 多维度指标构建
- 10.4 模型构建
- 10.5 模型评价
- 10.6 O2O平台营销手段和策略分析
- 10.7 小结
- 第11章 消费者人群画像
- 11.1 背景与目标
- 11.2 数据探索
- 11.3 数据预处理
- 11.4 消费者信用特征关联
- 11.5 模型构建
- 11.6 模型加载应用
- 11.7 小结
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。