展开全部

主编推荐语

本书9章讲解大数据起源、技术、组件,含实验手册,深入浅出。

内容简介

本书共分为9章,讲解了大数据的起源、概念,详细讲解大数据技术及相关组件的各种技术,包括HDFS、Sqoop、HBase、Kafka、Spark等主要组件。每个章节都配套有习题和实验手册。全文通俗易懂,深入浅出讲解了每个知识点。

目录

  • 版权信息
  • 内容简介
  • 主编介绍
  • 前言
  • 关于本书
  • 本书适合的读者
  • 联系方式与资源下载
  • 第1章 了解大数据
  • 1.1 大数据处理的基础技术
  • 1.1.1 大数据相关概念
  • 1.1.2 大数据处理流程
  • 1.1.3 大数据处理基础技术
  • 1.2 主流大数据技术
  • 1.2.1 主流大数据技术各阶段
  • 1.2.2 Hadoop生态系统
  • 1.2.3 Hadoop核心组件简介
  • 1.3 大数据平台解决方案
  • 1.3.1 Cloudera
  • 1.3.2 Hortonworks
  • 1.3.3 MapR
  • 1.3.4 FusionInsight
  • 1.3.5 Transwarp Data Hub
  • 1.4 大数据发展现状和趋势
  • 1.4.1 大数据市场规模
  • 1.4.2 国内大数据发展面临的问题
  • 1.4.3 大数据发展趋势
  • 1.5 习题
  • 第2章 大数据基础软件
  • 2.1 Linux基础介绍
  • 2.1.1 用户和用户组管理
  • 2.1.2 文件和目录操作
  • 2.1.3 文本编辑器
  • 2.2 Java基础介绍
  • 2.2.1 Java基础
  • 2.2.2 编程开发
  • 2.2.3 Java开发环境配置
  • 2.3 SQL语言基础介绍
  • 2.3.1 数据库基础
  • 2.3.2 SQL简介
  • 2.3.3 SQL语法
  • 2.3.4 SQL基础语法
  • 2.4 实验一:在Linux中安装和使用Java
  • 2.4.1 本实验目标
  • 2.4.2 本实验知识点
  • 2.4.3 项目实施过程
  • 2.4.4 常见问题
  • 2.5 实验二:在Linux中安装和使用MySQL
  • 2.5.1 本实验目标
  • 2.5.2 本实验知识点
  • 2.5.3 项目实施过程
  • 2.5.4 常见问题
  • 2.6 习题
  • 第3章 大数据采集
  • 3.1 大数据采集技术介绍
  • 3.2 常见采集工具和厂商
  • 3.2.1 搜索引擎查看
  • 3.2.2 工具分类
  • 3.3 八爪鱼采集器介绍
  • 3.3.1 八爪鱼采集原理
  • 3.3.2 八爪鱼实现的功能
  • 3.4 爬山虎采集器介绍
  • 3.4.1 爬山虎介绍
  • 3.4.2 产品特点和核心技术
  • 3.4.3 软件界面
  • 3.5 流数据采集工具Flume
  • 3.5.1 Flume背景
  • 3.5.2 Flume NG基本架构
  • 3.5.3 Flume案例分析
  • 3.6 数据传输工具Sqoop介绍
  • 3.6.1 Sqoop工具介绍
  • 3.6.2 Sqoop2特性
  • 3.6.3 Sqoop案例
  • 3.6.4 Sqoop问题集
  • 3.7 实验三:Sqoop的安装配置及使用
  • 3.7.1 本实验目标
  • 3.7.2 本实验知识点
  • 3.7.3 项目实施过程
  • 3.7.4 常见问题
  • 3.8 实验四:Kafka的安装、配置及使用
  • 3.8.1 本实验目标
  • 3.8.2 本实验知识点
  • 3.8.3 项目实施过程
  • 3.8.4 常见问题
  • 第4章 大数据存储
  • 4.1 数据库和数据仓库
  • 4.1.1 数据库类型简介
  • 4.1.2 数据仓库介绍
  • 4.2 分布式文件系统HDFS
  • 4.2.1 HDFS介绍
  • 4.2.2 HDFS体系结构
  • 4.3 分布式分析引擎Kylin介绍
  • 4.3.1 Kylin简介
  • 4.3.2 Kylin基本原理和架构
  • 4.3.3 Kylin的最新特性
  • 4.4 大数据仓库Hive
  • 4.4.1 Hive简介
  • 4.4.2 Hive体系结构
  • 4.4.3 Hive数据存储模型
  • 4.4.4 Hive应用场景
  • 4.5 NoSQL数据库
  • 4.5.1 NoSQL简介
  • 4.5.2 NoSQL在系统架构中的应用
  • 4.6 键-值存储数据库Memcached、Redis
  • 4.6.1 Redis基本介绍
  • 4.6.2 Redis命令总结
  • 4.7 面向文档数据库MongoDB介绍
  • 4.7.1 MongoDB简介
  • 4.7.2 MongoDB深入剖析
  • 4.8 实验五:Hadoop的安装、配置及HDFS使用
  • 4.8.1 本实验目标
  • 4.8.2 本实验知识点
  • 4.8.3 项目实施过程
  • 4.8.4 常见问题
  • 4.9 实验六:Redis数据库的安装与使用
  • 4.9.1 本实验目标
  • 4.9.2 本实验知识点
  • 4.9.3 项目实施过程
  • 4.9.4 常用命令及配置文件介绍
  • 4.10 实验七:HBase的安装和配置
  • 4.10.1 本实验目标
  • 4.10.2 本实验知识点
  • 4.10.3 项目实施过程
  • 4.10.4 常见问题
  • 4.11 习题
  • 第5章 Spark内存计算框架
  • 5.1 Spark简介
  • 5.2 Spark技术原理
  • 5.2.1 Spark与Hadoop的对比
  • 5.2.2 Spark运行架构
  • 5.2.3 RDD基本概念
  • 5.3 Spark SQL介绍
  • 5.4 Spark Streaming实时处理技术
  • 5.5 Spark MLlib数据挖掘库
  • 5.5.1 机器学习定义
  • 5.5.2 Spark MLlib的优势
  • 5.5.3 Spark MLlib支持的机器学习类型
  • 5.6 Spark GraphX图处理技术
  • 5.7 Spark编程实例
  • 第6章 大数据分析挖掘
  • 6.1 大数据分析概述
  • 6.1.1 数据分析与数据挖掘的区别
  • 6.1.2 常见数据分析挖掘工具
  • 6.1.3 数据挖掘十大算法介绍
  • 6.2 分类算法概述
  • 6.2.1 分类预测常见算法
  • 6.2.2 分类预测实现过程
  • 6.3 决策树算法介绍
  • 6.3.1 决策树的定义
  • 6.3.2 决策树的优缺点
  • 6.3.3 决策树的发展
  • 6.3.4 决策树的构造流程
  • 6.3.5 决策树的相关指标
  • 6.3.6 常见决策树算法
  • 6.4 推荐算法介绍
  • 6.4.1 常用推荐算法介绍
  • 6.4.2 主要推荐方法对比
  • 6.5 Apriori算法介绍
  • 6.5.1 Apriori算法
  • 6.5.2 频繁项集的评估标准
  • 6.5.3 Apriori算法思想
  • 6.5.4 Apriori算法流程
  • 6.5.5 Apriori算法小结
  • 第7章 大数据可视化
  • 7.1 大数据可视化概述
  • 7.1.1 数据可视化概述
  • 7.1.2 数据可视化流程
  • 7.1.3 数据可视化展现形式
  • 7.2 大数据可视化工具概述
  • 7.3 Tableau大数据可视化技术简介
  • 7.4 Power BI大数据可视化技术简介
  • 7.5 实验八:ECharts的安装与使用
  • 7.5.1 本实验目标
  • 7.5.2 本实验知识点
  • 7.5.3 项目实施过程
  • 7.5.4 常见问题
  • 第8章 大数据安全
  • 8.1 大数据安全的挑战与对策
  • 8.2 数据管理安全
  • 8.3 数据安全分析
  • 第9章 大数据应用
  • 9.1 企业大数据应用
  • 9.1.1 中国企业大数据现状
  • 9.1.2 企业大数据应用需求
  • 9.2 互联网大数据
  • 9.2.1 互联网行业拥有大数据的关键因素
  • 9.2.2 大数据方案后的价值体现
  • 9.3 零售大数据
  • 9.4 医疗大数据
  • 9.5 大数据未来展望
  • 9.6 大数据和云计算的关系
  • 9.6.1 云计算的特征
  • 9.6.2 云计算与大数据的关系
  • 9.6.3 云计算及其分布式结构是重要途径
  • 9.6.4 云数据库的必然
  • 9.6.5 云数据库需满足的要求
  • 9.6.6 云计算能为大数据带来的变化
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。