展开全部

主编推荐语

10余位大数据领域资深专家和科研人员10余年大数据挖掘的经验结晶。

内容简介

这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你完全没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。

全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。掌握了这些内容,就具备了大数据技术的基础;挖掘实战篇(8章),主要是一个企业级大数据应用项目——电子商务智能推荐系统。通过分析应用背景、构建系统,使读者了解针对系统的每一层应用使用什么大数据技术来解决问题。涉及的流程有数据采集、数据预处理、模型构建等,在每一个流程中会进行大数据相关技术实践,运用实际数据来进行分析,使读者切身感受到利用大数据技术解决问题的魅力。

目录

  • 版权信息
  • 前言
  • 第一篇 基础篇
  • 第1章 浅谈大数据
  • 1.1 大数据概述
  • 1.2 大数据平台
  • 1.3 本章小结
  • 第2章 大数据存储与运算利器—Hadoop
  • 2.1 Hadoop概述
  • 2.2 Hadoop配置及IDE配置
  • 2.3 Hadoop集群命令
  • 2.4 Hadoop编程开发
  • 2.5 K-Means算法原理及Hadoop MapReduce实现
  • 2.6 TF-IDF算法原理及Hadoop MapReduce实现
  • 2.7 本章小结
  • 第3章 大数据查询—Hive
  • 3.1 Hive概述
  • 3.2 HiveQL语句
  • 3.3 动手实践:基于Hive的学生信息查询
  • 3.4 基于Hive的航空公司客户价值数据预处理及分析
  • 3.5 本章小结
  • 第4章 大数据快速读写—HBase
  • 4.1 HBase概述
  • 4.2 配置HBase集群
  • 4.3 HBase原理与架构组件
  • 4.4 HBase Shell操作
  • 4.5 Java API&MapReduce与HBase交互
  • 4.6 基于HBase的冠字号查询系统
  • 4.7 本章小结
  • 第5章 大数据处理—Pig
  • 5.1 Pig概述
  • 5.2 配置运行Pig
  • 5.3 常用Pig Latin操作
  • 5.4 综合实践
  • 5.5 本章小结
  • 第6章 大数据快速运算与挖掘—Spark
  • 6.1 Spark概述
  • 6.2 Spark安装集群
  • 6.3 Spark架构与核心原理
  • 6.4 Spark编程技巧
  • 6.5 如何学习Spark MLlib
  • 6.6 动手实践:基于Spark ALS电影推荐系统
  • 6.7 本章小结
  • 第7章 大数据工作流—Oozie
  • 7.1 Oozie简介
  • 7.2 编译配置并运行Oozie
  • 7.3 Oozie WorkFlow实践
  • 7.4 Oozie Coordinator实践
  • 7.5 本章小结
  • 第二篇 挖掘实战篇
  • 第8章 法律服务大数据智能推荐
  • 8.1 背景
  • 8.2 目标
  • 8.3 系统架构及流程
  • 8.4 分析过程及实现
  • 8.5 构建法律服务大数据智能推荐系统
  • 8.6 本章小结
展开全部

评分及书评

评分不足
1个评分
  • 用户头像
    给这本书评了
    5.0

    本书提供了大数据相关技术的简介、原理、实践、企业应用等,针对大数据相关技术,如 HadoopHBaseHiveSpark 等,都有专业章节进行介绍,并且针对每一模块都有相应的动手实践,能有效加深读者对大数据相关技术原理、技术实践的理解。书中的挖掘实践篇涉及企业在大数据应用中的所有环节,如数据采集、数据预处理、数据挖掘等,通过案例对整个系统的架构进行了详细分析,对读者有一定实践指导作用。

      转发
      评论

    出版方

    机械工业出版社有限公司

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。