互联网
类型
8.4
豆瓣评分
可以朗读
语音朗读
192千字
字数
2021-03-01
发行日期
展开全部
主编推荐语
作为高性能分布式SQL查询引擎,Presto能够针对不同的数据源高效、快速地执行交互式分析。
内容简介
随着各行各业对大数据实时查询的需求持续增长,数据查询及分析引擎正变得不可或缺。Presto是由Facebook开源的高性能分布式SQL查询引擎,其用户包括Netflix、Airbnb、LinkedIn、Twitter、Uber等知名公司。
本书由Presto的核心开发人员参与撰写,教你系统地学习Presto的用法。书中内容涵盖Presto的安装、设计理念、查询操作与主要云平台的结合等。本书分为三大部分:第一部分介绍Presto的基础知识;第二部分更进一步,介绍Presto架构、集群部署、与数据源的连接等;第三部分讲解安全配置以及Presto的实际用例。
你可以通过本书学会针对不同的数据源快速执行交互式SQL数据分析,并利用Presto管理和使用海量数据。
目录
- 版权信息
- O'Reilly Media, Inc. 介绍
- 本书赞誉
- 译者序
- 序
- 前言
- 第一部分 Presto入门
- 第1章 Presto介绍
- 1.1 大数据带来的问题
- 1.2 Presto来救场
- 1.3 Presto使用场景
- 1.4 Presto资源
- 1.5 Presto简史
- 1.6 小结
- 第2章 安装和配置Presto
- 2.1 使用Docker容器尝试Presto
- 2.2 使用归档文件安装
- 2.3 添加数据源
- 2.4 运行Presto
- 2.5 小结
- 第3章 使用Presto
- 3.1 Presto CLI
- 3.2 Presto JDBC驱动
- 3.3 Presto与ODBC
- 3.4 客户端库
- 3.5 Presto Web UI
- 3.6 使用Presto执行SQL
- 3.7 小结
- 第二部分 深入理解Presto
- 第4章 Presto的架构
- 4.1 集群中的协调器和工作节点
- 4.2 协调器
- 4.3 节点发现服务
- 4.4 工作节点
- 4.5 基于连接器的架构
- 4.6 catalog、schema和表
- 4.7 查询执行模型
- 4.8 查询优化
- 4.9 优化规则
- 4.10 实现规则
- 4.11 基于代价的优化器
- 4.12 使用表统计信息
- 4.13 小结
- 第5章 生产环境部署
- 5.1 配置细节
- 5.2 服务端配置
- 5.3 日志
- 5.4 节点配置
- 5.5 JVM配置
- 5.6 启动器
- 5.7 集群安装
- 5.8 使用RPM安装
- 5.9 在云上安装
- 5.10 集群规模的考量
- 5.11 小结
- 第6章 连接器
- 6.1 配置
- 6.2 RDBMS连接器示例:PostgreSQL
- 6.3 Presto TPC-H和TPC-DS连接器
- 6.4 用于分布式存储数据源的Hive连接器
- 6.5 非关系数据源
- 6.6 Presto JMX连接器
- 6.7 黑洞连接器
- 6.8 内存连接器
- 6.9 其他连接器
- 6.10 小结
- 第7章 高级连接器实例
- 7.1 用Phoenix连接HBase
- 7.2 键值存储连接器示例:Accumulo
- 7.3 Apache Cassandra连接器
- 7.4 流式系统连接器示例:Kafka
- 7.5 文档存储连接器示例:Elasticsearch
- 7.6 Presto中的联邦查询
- 7.7 ETL和联合查询
- 7.8 小结
- 第8章 在Presto中使用SQL
- 8.1 Presto语句
- 8.2 Presto系统表
- 8.3 catalog
- 8.4 schema
- 8.5 Information Schema
- 8.6 表
- 8.7 视图
- 8.8 会话信息和配置
- 8.9 数据类型
- 8.10 SELECT语句基础
- 8.11 WHERE子句
- 8.12 GROUP BY和HAVING子句
- 8.13 ORDER BY子句和LIMIT子句
- 8.14 JOIN语句
- 8.15 UNION、INTERSECT和EXCEPT子句
- 8.16 分组操作
- 8.17 WITH子句
- 8.18 子查询
- 8.19 从表中删除数据
- 8.20 小结
- 第9章 高级SQL特性
- 9.1 函数和运算符介绍
- 9.2 标量函数和运算符
- 9.3 布尔运算符
- 9.4 逻辑运算符
- 9.5 用BETWEEN语句选择范围
- 9.6 用IS (NOT) NULL检测值的存在
- 9.7 数学函数和运算符
- 9.8 三角函数
- 9.9 常数和随机函数
- 9.10 字符串函数和运算符
- 9.11 字符串和映射
- 9.12 Unicode
- 9.13 正则表达式
- 9.14 解嵌套复杂数据类型
- 9.15 JSON函数
- 9.16 日期和时间函数及运算符
- 9.17 直方图
- 9.18 聚合函数
- 9.19 窗函数
- 9.20 lambda表达式
- 9.21 地理空间函数
- 9.22 Prepared Statement
- 9.23 小结
- 第三部分 Presto的实际应用
- 第10章 安全
- 10.1 认证
- 10.2 授权
- 10.3 加密
- 10.4 CA与自签名证书
- 10.5 证书认证
- 10.6 Kerberos
- 10.7 数据源访问和安全配置
- 10.8 使用Hive连接器进行Kerberos验证
- 10.9 集群分离
- 10.10 小结
- 第11章 将Presto与其他工具集成
- 11.1 使用Apache Superset进行查询、可视化和更多操作
- 11.2 使用RubiX提高性能
- 11.3 使用Apache Airflow的工作流
- 11.4 嵌入式Presto示例:Amazon Athena
- 11.5 Starburst企业版Presto
- 11.6 其他集成案例
- 11.7 自定义集成
- 11.8 小结
- 第12章 生产环境中的Presto
- 12.1 使用Presto Web UI监控
- 12.2 Presto SQL查询调优
- 12.3 内存管理
- 12.4 任务并发性
- 12.5 工作节点调度
- 12.6 网络数据交换
- 12.7 JVM调优
- 12.8 资源组
- 12.9 小结
- 第13章 真实世界的案例
- 13.1 部署和运行时平台
- 13.2 集群规模
- 13.3 Hadoop/Hive迁移的使用场景
- 13.4 其他数据源
- 13.5 用户和流量
- 13.6 小结
- 第14章 总结
- 关于作者
- 关于封面
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。