展开全部

主编推荐语

深入探索实时分析系统。

内容简介

本书为想要设计、构建和维护实时分析应用程序的人员(包括数据工程师、架构师和技术领导者)提供了结构合理的基础知识。

第1章和第2章简要介绍实时分析,并概述可以构建的实时分析应用程序的类型。第3章介绍一家虚构的比萨公司,该公司已经建立了流处理基础设施,但尚未实现任何实时分析功能。第4~10章展示如何为这家比萨公司实现不同类型的实时分析应用程序。第11~13章介绍将应用程序投入生产时的注意事项、实时分析的一些真实使用案例,以及未来几年该领域可能会出现的情况。

目录

  • 版权信息
  • O'Reilly Media, Inc.介绍
  • 译者序
  • 前言
  • 第1章 实时分析简介
  • 1.1 什么是事件流
  • 1.2 理解流数据
  • 1.3 什么是实时分析
  • 1.4 实时分析的优势
  • 1.4.1 新的收入来源
  • 1.4.2 及时洞察客户
  • 1.4.3 降低基础设施成本
  • 1.4.4 改善整体客户体验
  • 1.5 实时分析用例
  • 1.5.1 面向用户的分析
  • 1.5.2 个性化
  • 1.5.3 指标
  • 1.5.4 异常检测和根本原因分析
  • 1.5.5 可视化
  • 1.5.6 即时分析
  • 1.5.7 日志分析/文本搜索
  • 1.6 对实时分析应用程序进行分类
  • 1.6.1 面向内部与面向外部
  • 1.6.2 面向机器与面向人类
  • 1.7 本章小结
  • 第2章 实时分析生态系统
  • 2.1 定义实时分析生态系统
  • 2.2 经典流处理技术栈
  • 2.2.1 复杂事件处理
  • 2.2.2 大数据时代
  • 2.3 现代流处理技术栈
  • 2.3.1 事件生成器
  • 2.3.2 流处理数据平台
  • 2.3.3 流处理层
  • 2.3.4 服务层
  • 2.3.5 前端
  • 2.4 本章小结
  • 第3章 介绍AATD:比萨外卖店的实时分析
  • 3.1 现有架构
  • 3.2 设置
  • 3.2.1 MySQL
  • 3.2.2 Apache Kafka
  • 3.2.3 ZooKeeper
  • 3.2.4 订单服务
  • 3.2.5 启动组件
  • 3.3 检查数据
  • 3.4 实时分析的应用
  • 3.5 本章小结
  • 第4章 使用Kafka Streams进行查询
  • 4.1 什么是Kafka Streams
  • 4.2 什么是Quarkus
  • 4.3 Quarkus应用程序
  • 4.3.1 安装Quarkus CLI
  • 4.3.2 创建Quarkus应用程序
  • 4.3.3 创建拓扑结构
  • 4.3.4 查询键值存储
  • 4.3.5 创建HTTP端点
  • 4.4 运行应用程序
  • 4.5 查询HTTP端点
  • 4.6 Kafka Streams的局限性
  • 4.7 本章小结
  • 第5章 服务层
  • 5.1 为什么不能使用其他流处理器
  • 5.2 为什么不能使用数据仓库
  • 5.3 什么是Apache Pinot
  • 5.4 Pinot如何对数据进行建模和存储
  • 5.4.1 数据模式
  • 5.4.2 表
  • 5.5 配置
  • 5.6 数据摄取
  • 5.7 Pinot数据浏览器
  • 5.8 索引
  • 5.9 更新Web应用程序
  • 5.10 本章小结
  • 第6章 构建实时分析仪表盘
  • 6.1 仪表盘架构
  • 6.2 什么是Streamlit
  • 6.3 配置
  • 6.4 构建仪表盘
  • 6.5 本章小结
  • 第7章 通过CDC获取产品变化
  • 7.1 从业务数据库获取更改信息
  • 7.2 CDC
  • 7.2.1 为什么需要CDC
  • 7.2.2 什么是CDC
  • 7.2.3 实施CDC的策略
  • 7.2.4 基于日志的数据采集
  • 7.2.5 CDC系统的需求
  • 7.2.6 Debezium
  • 7.3 将CDC应用于AATD
  • 7.3.1 配置
  • 7.3.2 将Debezium连接到MySQL
  • 7.3.3 查询商品数据流
  • 7.3.4 更新产品
  • 7.4 本章小结
  • 第8章 使用Kafka Streams连接流
  • 8.1 使用Kafka Streams丰富订单数据
  • 8.2 将订单项添加到Pinot
  • 8.3 更新订单服务信息
  • 8.4 刷新Streamlit仪表盘
  • 8.5 本章小结
  • 第9章 服务层的插入更新
  • 9.1 订单状态
  • 9.2 丰富订单流信息
  • 9.3 Apache Pinot的插入更新
  • 9.4 更新订单服务
  • 9.4.1 创建用户资源文件
  • 9.4.2 添加一个所有用户的端点
  • 9.4.3 为用户端点添加订单
  • 9.4.4 添加单个订单端点
  • 9.4.5 实现跨资源共享
  • 9.5 前端应用程序
  • 9.6 仪表盘上的订单状态
  • 9.6.1 每个订单状态的耗时
  • 9.6.2 可能被延误的订单
  • 9.7 本章小结
  • 第10章 地理空间查询
  • 10.1 交付状态
  • 10.2 更新Apache Pinot
  • 10.2.1 订单
  • 10.2.2 交付状态
  • 10.3 更新订单服务
  • 10.3.1 个人订单
  • 10.3.2 按地区划分的延迟订单
  • 10.3.3 使用新的API端点
  • 10.4 本章小结
  • 第11章 生产环境中的注意事项
  • 11.1 前期准备
  • 11.1.1 容量规划
  • 11.1.2 数据分区
  • 11.1.3 吞吐量
  • 11.1.4 数据保留
  • 11.1.5 数据粒度
  • 11.1.6 总数据大小
  • 11.1.7 复制因子
  • 11.2 部署平台
  • 11.2.1 自身技能
  • 11.2.2 数据隐私和安全
  • 11.2.3 成本
  • 11.2.4 控制
  • 11.3 后期管理
  • 11.3.1 监控和报警
  • 11.3.2 数据治理
  • 11.4 本章小结
  • 第12章 现实世界中的实时分析
  • 12.1 内容推荐(专业社交网络)
  • 12.1.1 问题
  • 12.1.2 解决方案
  • 12.1.3 收益
  • 12.2 运营分析(流媒体服务)
  • 12.2.1 问题
  • 12.2.2 解决方案
  • 12.2.3 收益
  • 12.3 实时广告分析(网上商城)
  • 12.3.1 问题
  • 12.3.2 解决方案
  • 12.3.3 收益
  • 12.4 面向用户的分析(协作平台)
  • 12.4.1 问题
  • 12.4.2 解决方案
  • 12.4.3 收益
  • 12.5 本章小结
  • 第13章 实时分析的未来
  • 13.1 边缘分析
  • 13.2 计算存储分离
  • 13.3 湖仓一体
  • 13.4 实时数据可视化
  • 13.5 流式数据库
  • 13.6 流数据平台即服务
  • 13.7 反向ETL
  • 13.8 本章小结
  • 作者简介
  • 封面简介
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

机械工业出版社

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。