展开全部

主编推荐语

一本介绍实时大数据计算领域的相关技巧和经验(包括Flink、Spark、Storm、Kafka等流处理框架技术)的开发实战指南。

内容简介

本书主要介绍实时大数据计算领域的相关技巧和经验,包括Flink、Spark和Storm等流处理框架技术。全书从搭建开发环境开始,逐步实现流处理,循序渐进地引导读者学习如何利用Rabbit MQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等组件协同应用来解决实际问题。本书内容分为6个部分,分别是“导言——熟悉实时分析”“搭建基础设施”“Storm实时计算”“使用Spark实现实时计算”“使用Flink实现实时分析”以及“综合应用”。 在阅读本书之前,读者应具备基本的Java和Scala编程基础,还应熟悉Maven、Java和Eclipse的安装和配置流程。

目录

  • 版权信息
  • 版权声明
  • 内容提要
  • 作者简介
  • 前言
  • 本书内容概述
  • 阅读基础
  • 读者对象
  • 本书约定
  • 审稿人简介
  • 资源与支持
  • 配套资源
  • 提交勘误
  • 与我们联系
  • 关于异步社区和异步图书
  • 第一部分 导言——熟悉实时分析
  • 第1章 实时分析简介
  • 1.1 大数据的定义
  • 1.2 大数据的基础设施
  • 1.3 实时分析——神话与现实
  • 1.4 近实时解决方案——可用的架构
  • 1.5 Lambda架构——分析可能性
  • 1.6 物联网——想法与可能性
  • 1.7 云——考虑NRT和物联网
  • 1.8 小结
  • 第2章 实时应用的基本组件
  • 2.1 NRT系统及其构建模块
  • 2.2 NRT的高级系统视图
  • 2.3 NRT的技术视图
  • 2.4 小结
  • 第二部分 搭建基础设施
  • 第3章 了解和跟踪数据流
  • 3.1 了解数据流
  • 3.2 为数据提取安装基础设施
  • 3.3 将数据从源填到处理器——期望和注意事项
  • 3.4 比较与选择适合用例的最佳实践
  • 3.5 小试牛刀
  • 3.6 小结
  • 第4章 安装和配置Storm
  • 4.1 Storm概述
  • 4.2 Storm架构和组件
  • 4.3 安装和配置Storm
  • 4.4 在Storm上实时处理任务
  • 4.5 小结
  • 第5章 配置Apache Spark和Flink
  • 5.1 安装并快速运行Spark
  • 5.2 安装并快速运行Flink
  • 5.3 安装并快速运行Apache Beam
  • 5.4 Apache Beam中的平衡
  • 5.5 小结
  • 第三部分 Storm实时计算
  • 第6章 集成Storm与数据源
  • 6.1 RabbitMQ有效的消息传递
  • 6.2 RabbitMQ交换器
  • 6.3 RabbitMQ与Storm集成
  • 6.4 PubNub数据流发布者
  • 6.5 将Storm和RMQ_PubNub传感器数据拓扑串在一起
  • 6.6 小结
  • 第7章 从Storm到Sink
  • 7.1 安装并配置Cassandra
  • 7.2 Storm和Cassandra拓扑
  • 7.3 Storm和IMDB集成处理维度数据
  • 7.4 集成表示层与Storm
  • 7.5 小试牛刀
  • 7.6 小结
  • 第8章 Storm Trident
  • 8.1 状态保持和Trident
  • 8.2 基本Storm Trident拓扑
  • 8.3 Trident内部实现
  • 8.4 Trident操作
  • 8.5 DRPC
  • 8.6 小试牛刀
  • 8.7 小结
  • 第四部分 使用Spark实现实时计算
  • 第9章 运用Spark引擎
  • 9.1 Spark概述
  • 9.2 Spark的独特优势
  • 9.3 Spark用例
  • 9.4Spark架构——引擎内部的运行模式
  • 9.5 Spark的语用概念
  • 9.6 Spark 2.x——数据框和数据集的出现
  • 9.7 小结
  • 第10章 运用Spark操作
  • 10.1 Spark——封装和API
  • 10.2 RDD语用探索
  • 10.3 共享变量——广播变量和累加器
  • 10.4 小结
  • 第11章 Spark Streaming
  • 11.1 Spark Streaming的概念
  • 11.2 Spark Streaming的简介和体系结构
  • 11.3 Spark Streaming的封装结构
  • 11.4 连接Kafka和Spark Streaming
  • 11.5 小结
  • 第五部分 使用Flink实现实时分析
  • 第12章 运用Apache Flink
  • 12.1 Flink体系结构和执行引擎
  • 12.2 Flink的基本组件和进程
  • 12.3 将源流集成到Flink
  • 12.4 Flink处理和计算
  • 12.5 Flink持久化
  • 12.6 Flink CEP
  • 12.7 Pattern API
  • 12.8 Gelly
  • 12.9 小试牛刀
  • 12.10 小结
  • 第六部分 综合应用
  • 第13章 用例研究
  • 13.1 概述
  • 13.2 数据建模
  • 13.3 工具和框架
  • 13.4 建立基础设施
  • 13.5 实现用例
  • 13.6 运行用例
  • 13.7 小结
展开全部

评分及书评

评分不足
2个评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。