互联网
类型
可以朗读
语音朗读
226千字
字数
2020-05-01
发行日期
展开全部
主编推荐语
一本介绍实时大数据计算领域的相关技巧和经验(包括Flink、Spark、Storm、Kafka等流处理框架技术)的开发实战指南。
内容简介
本书主要介绍实时大数据计算领域的相关技巧和经验,包括Flink、Spark和Storm等流处理框架技术。全书从搭建开发环境开始,逐步实现流处理,循序渐进地引导读者学习如何利用Rabbit MQ、Kafka和NiFi以及Storm、Spark、Flink和Beam等组件协同应用来解决实际问题。本书内容分为6个部分,分别是“导言——熟悉实时分析”“搭建基础设施”“Storm实时计算”“使用Spark实现实时计算”“使用Flink实现实时分析”以及“综合应用”。 在阅读本书之前,读者应具备基本的Java和Scala编程基础,还应熟悉Maven、Java和Eclipse的安装和配置流程。
目录
- 版权信息
- 版权声明
- 内容提要
- 作者简介
- 前言
- 本书内容概述
- 阅读基础
- 读者对象
- 本书约定
- 审稿人简介
- 资源与支持
- 配套资源
- 提交勘误
- 与我们联系
- 关于异步社区和异步图书
- 第一部分 导言——熟悉实时分析
- 第1章 实时分析简介
- 1.1 大数据的定义
- 1.2 大数据的基础设施
- 1.3 实时分析——神话与现实
- 1.4 近实时解决方案——可用的架构
- 1.5 Lambda架构——分析可能性
- 1.6 物联网——想法与可能性
- 1.7 云——考虑NRT和物联网
- 1.8 小结
- 第2章 实时应用的基本组件
- 2.1 NRT系统及其构建模块
- 2.2 NRT的高级系统视图
- 2.3 NRT的技术视图
- 2.4 小结
- 第二部分 搭建基础设施
- 第3章 了解和跟踪数据流
- 3.1 了解数据流
- 3.2 为数据提取安装基础设施
- 3.3 将数据从源填到处理器——期望和注意事项
- 3.4 比较与选择适合用例的最佳实践
- 3.5 小试牛刀
- 3.6 小结
- 第4章 安装和配置Storm
- 4.1 Storm概述
- 4.2 Storm架构和组件
- 4.3 安装和配置Storm
- 4.4 在Storm上实时处理任务
- 4.5 小结
- 第5章 配置Apache Spark和Flink
- 5.1 安装并快速运行Spark
- 5.2 安装并快速运行Flink
- 5.3 安装并快速运行Apache Beam
- 5.4 Apache Beam中的平衡
- 5.5 小结
- 第三部分 Storm实时计算
- 第6章 集成Storm与数据源
- 6.1 RabbitMQ有效的消息传递
- 6.2 RabbitMQ交换器
- 6.3 RabbitMQ与Storm集成
- 6.4 PubNub数据流发布者
- 6.5 将Storm和RMQ_PubNub传感器数据拓扑串在一起
- 6.6 小结
- 第7章 从Storm到Sink
- 7.1 安装并配置Cassandra
- 7.2 Storm和Cassandra拓扑
- 7.3 Storm和IMDB集成处理维度数据
- 7.4 集成表示层与Storm
- 7.5 小试牛刀
- 7.6 小结
- 第8章 Storm Trident
- 8.1 状态保持和Trident
- 8.2 基本Storm Trident拓扑
- 8.3 Trident内部实现
- 8.4 Trident操作
- 8.5 DRPC
- 8.6 小试牛刀
- 8.7 小结
- 第四部分 使用Spark实现实时计算
- 第9章 运用Spark引擎
- 9.1 Spark概述
- 9.2 Spark的独特优势
- 9.3 Spark用例
- 9.4Spark架构——引擎内部的运行模式
- 9.5 Spark的语用概念
- 9.6 Spark 2.x——数据框和数据集的出现
- 9.7 小结
- 第10章 运用Spark操作
- 10.1 Spark——封装和API
- 10.2 RDD语用探索
- 10.3 共享变量——广播变量和累加器
- 10.4 小结
- 第11章 Spark Streaming
- 11.1 Spark Streaming的概念
- 11.2 Spark Streaming的简介和体系结构
- 11.3 Spark Streaming的封装结构
- 11.4 连接Kafka和Spark Streaming
- 11.5 小结
- 第五部分 使用Flink实现实时分析
- 第12章 运用Apache Flink
- 12.1 Flink体系结构和执行引擎
- 12.2 Flink的基本组件和进程
- 12.3 将源流集成到Flink
- 12.4 Flink处理和计算
- 12.5 Flink持久化
- 12.6 Flink CEP
- 12.7 Pattern API
- 12.8 Gelly
- 12.9 小试牛刀
- 12.10 小结
- 第六部分 综合应用
- 第13章 用例研究
- 13.1 概述
- 13.2 数据建模
- 13.3 工具和框架
- 13.4 建立基础设施
- 13.5 实现用例
- 13.6 运行用例
- 13.7 小结
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。