展开全部

主编推荐语

系统讲解流式处理核心、本质的概念、特性、设计和方法。

内容简介

本书分为两部分:第一部分以Beam的编程模型为抓手讨论流处理的种种核心问题,重点是相对高层次地讨论批处理模型以及流处理模型;第二部分讨论流与表的二象性,即两者之间的类比与差异,对概念进行深入探讨,并讨论关于流处理的“流与表”的思考方式。

本书还概要浏览大数据处理系统的家族历史,深入讨论流式系统发展领域的一些重要贡献。此外,本书配有大量的动画示意图,读者可以在线查看相关动图示例。

目录

  • 版权信息
  • 内容提要
  • O'Reilly Media, Inc.介绍
  • 推荐序
  • 译者序
  • 前言
  • 第一部分 Beam模型
  • 第1章 流式入门
  • 1.1 术语:什么是流式
  • 1.2 数据处理模式
  • 1.3 小结
  • 第2章 数据处理的来龙去脉
  • 2.1 路线图
  • 2.2 批处理基础:定义及位置
  • 2.3 开始流式处理:时机及方法
  • 2.4 小结
  • 第3章 水位
  • 3.1 定义
  • 3.2 源水位的创建
  • 3.3 水位传播
  • 3.4 百分位数水位
  • 3.5 处理时间水位
  • 3.6 案例分析
  • 3.7 小结
  • 第4章 高级开窗
  • 4.1 时机/位置:处理时间开窗
  • 4.2 位置:会话
  • 4.3 位置:自定义开窗
  • 4.4 小结
  • 第5章 精确一次及副作用
  • 5.1 为什么精确一次这么重要
  • 5.2 准确性与完整性
  • 5.3 确保在混洗中精确一次
  • 5.4 解决确定性
  • 5.5 性能
  • 5.6 源端的精确一次
  • 5.7 汇端的精确一次
  • 5.8 使用场景
  • 5.9 其他系统
  • 5.10 小结
  • 第二部分 流和表
  • 第6章 流和表
  • 6.1 流和表的基础:流表相对性的特殊理论
  • 6.2 批处理与流和表
  • 6.3 流和表世界的定义、位置、时机和方法
  • 6.4 流表相对性的通用理论
  • 6.5 小结
  • 第7章 持久状态的实践
  • 7.1 动机
  • 7.2 隐式状态
  • 7.3 通用状态
  • 7.4 小结
  • 第8章 流式SQL
  • 8.1 什么是流式SQL
  • 8.2 回顾:流和表的偏好
  • 8.3 展望:迈向健壮的流式SQL
  • 8.4 小结
  • 第9章 流式连接
  • 9.1 所有连接都是流式连接
  • 9.2 非开窗连接
  • 9.3 开窗连接
  • 9.4 小结
  • 第10章 大规模数据处理的演进
  • 10.1 MapReduce
  • 10.2 Hadoop
  • 10.3 Flume
  • 10.4 Storm
  • 10.5 Spark
  • 10.6 MillWheel
  • 10.7 Kafka
  • 10.8 Cloud Dataflow
  • 10.9 Flink
  • 10.10 Beam
  • 10.11 小结
  • 关于作者
  • 关于封面
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。