展开全部

主编推荐语

覆盖当前大数据处理领域的热门技术,详细分析了各种技术的应用场景和优缺点。

内容简介

本书阐述了大数据下的日志分析系统,重点讲解了ELK日志处理方案;最后分析了大数据处理技术的发展趋势。

本书适合大数据开发、大数据测试人员,以及其他软件开发或者管理人员和计算爱好者阅读。

目录

  • 版权信息
  • 内容简介
  • 前言
  • 0 “疯狂”的大数据
  • 0.1 大数据时代
  • 0.2 数据就是“金库”
  • 0.3 让大数据“活”起来
  • 第1篇 Hadoop军营
  • 1 Hadoop一石激起千层浪
  • 1.1 Hadoop诞生
  • 1.2 Hadoop发展
  • 1.3 Hadoop和它的小伙伴们
  • 1.4 Hadoop应用场景
  • 1.5 小结
  • 2 MapReduce奠定基石
  • 2.1 MapReduce设计思想
  • 2.2 MapReduce运行机制
  • 2.3 MapReduce实例分析
  • 2.4 小结
  • 3 分布式文件系统
  • 3.1 群雄并起的DFS
  • 3.2 HDFS文件系统
  • 3.3 小结
  • 4 Hadoop体系的“四剑客”
  • 4.1 数据仓库工具Hive
  • 4.2 大数据仓库HBase
  • 4.3 Pig编程语言
  • 4.4 协管员ZooKeeper
  • 4.5 小结
  • 5 Hadoop资源管理与调度
  • 5.1 Hadoop调度机制
  • 5.2 Hadoop YARN资源调度
  • 5.3 Apache Mesos资源调度
  • 5.4 Mesos与YARN对比
  • 5.5 小结
  • 6 Hadoop集群管理之道
  • 6.1 Hadoop集群管理与维护
  • 6.2 Hadoop集群调优
  • 6.3 Hadoop集群监控
  • 6.4 小结
  • 第2篇 Spark星火燎原
  • 7 Spark宝刀出鞘
  • 7.1 Spark的历史渊源
  • 7.2 Spark和Hadoop MapReduce对比
  • 7.3 Spark的适用场景
  • 7.4 Spark的硬件配置
  • 7.5 Spark架构
  • 7.6 小结
  • 8 Spark核心RDD
  • 8.1 RDD简介
  • 8.2 RDD的存储级别
  • 8.3 RDD依赖与容错
  • 8.4 RDD操作与接口
  • 8.5 RDD编程示例
  • 8.6 小结
  • 9 Spark运行模式和流程
  • 9.1 Spark运行模式
  • 9.2 Spark作业流程
  • 9.3 小结
  • 10 Shark和Spark SQL
  • 10.1 从Shark到Spark SQL
  • 10.2 Spark SQL应用架构
  • 10.3 Spark SQL之DataFrame
  • 10.4 Spark SQL运行过程分析
  • 10.5 小结
  • 11 Spark Streaming流数据处理新贵
  • 11.1 Spark Streaming是什么
  • 11.2 Spark Streaming的架构
  • 11.3 Spark Streaming的操作
  • 11.4 Spark Streaming性能调优
  • 11.5 小结
  • 12 Spark GraphX图计算系统
  • 12.1 图计算系统
  • 12.2 Spark GraphX的框架
  • 12.3 Spark GraphX的存储模式
  • 12.4 Spark GraphX的图运算符
  • 12.5 小结
  • 13 Spark Cluster管理
  • 13.1 Spark Cluster部署
  • 13.2 Spark Cluster管理与监控
  • 13.3 Spark高可用性
  • 13.4 小结
  • 第3篇 其他大数据处理技术
  • 14 专为流数据而生的Storm
  • 14.1 Storm起因
  • 14.2 Storm的架构与组件
  • 14.3 Storm的设计思想
  • 14.4 Storm与Spark的区别
  • 14.5 Storm的适用场景
  • 14.6 Storm的应用
  • 14.7 小结
  • 15 Dremel和Drill
  • 15.1 Dremel和Drill的历史背景
  • 15.2 Dremel的原理与应用
  • 15.3 Drill的架构与流程
  • 15.4 Dremel和Drill的适用场景与应用
  • 15.5 小结
  • 第4篇 大数据下的日志分析系统
  • 16 日志分析解决方案
  • 16.1 百花齐放的日志处理技术
  • 16.2 日志处理方案ELK
  • 16.3 Logstash日志收集解析
  • 16.4 ElasticSearch存储与搜索
  • 16.5 Kibana展示
  • 16.6 小结
  • 17 ELK集群部署与应用
  • 17.1 ELK集群部署与优化
  • 17.2 如何开发自己的插件
  • 17.3 ELK在大数据运维系统中的应用
  • 17.4 ELK实战应用
  • 17.5 小结
  • 第5篇 数据分析技术前景展望
  • 18 大数据处理的思考与展望
  • 18.1 大数据时代的思考
  • 18.2 大数据处理技术的发展趋势
  • 18.3 小结
展开全部

评分及书评

评分不足
1个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。