科技
类型
可以朗读
语音朗读
157千字
字数
2023-07-01
发行日期
展开全部
主编推荐语
本书详细介绍了开源的分布式SQL查询引擎Trino涉及的方方面面的知识。
内容简介
全书共三部分,第一部分介绍Trino的发展历史、主要功能以及如何安装和使用它,第二部分介绍Trino的内部架构、部署、连接器和所支持的SQL语句的使用等,第三部分介绍在生产环境中部署Trino的知识,以及一些真实世界的部署案例。
通过学习本书,你将了解Trino在解决海量数据分析和查询问题方面的优越性,并学会在现实场景中使用它来高效地解决需要在短时间内返回结果的大数据查询问题。
目录
- 版权信息
- O'Reilly Media, Inc. 介绍
- 本书赞誉
- 译者序
- 序
- 前言
- 第一部分 Trino入门
- 第1章 Trino介绍
- 1.1 大数据带来的问题
- 1.2 Trino来救场
- 1.3 Trino使用场景
- 1.4 Trino资源
- 1.5 Trino简史
- 1.6 小结
- 第2章 安装和配置Trino
- 2.1 使用Docker容器探索Trino
- 2.2 使用归档文件安装Trino
- 2.3 添加数据源
- 2.4 运行Trino
- 2.5 小结
- 第3章 使用Trino
- 3.1 Trino CLI
- 3.2 Trino JDBC驱动
- 3.3 Trino与ODBC
- 3.4 客户端库
- 3.5 Trino Web UI
- 3.6 使用Trino执行SQL
- 3.7 小结
- 第二部分 深入理解Trino
- 第4章 Trino架构
- 4.1 集群中的协调器和工作节点
- 4.2 基于连接器的架构
- 4.3 catalog、schema和表
- 4.4 查询执行模型
- 4.5 查询计划
- 4.6 优化规则
- 4.7 实现规则
- 4.8 基于代价的优化器
- 4.9 使用表统计信息
- 4.10 小结
- 第5章 生产环境部署
- 5.1 配置细节
- 5.2 服务端配置
- 5.3 日志
- 5.4 节点配置
- 5.5 JVM配置
- 5.6 启动器
- 5.7 集群安装
- 5.8 使用RPM安装
- 5.9 在云上安装
- 5.10 用Helm chart部署Kubernetes
- 5.11 考虑集群规模
- 5.12 小结
- 第6章 连接器
- 6.1 配置
- 6.2 RDBMS连接器示例:PostgreSQL
- 6.3 TPC-H连接器和TPC-DS连接器
- 6.4 用于分布式存储数据源的Hive连接器
- 6.5 现代分布式存储管理和分析
- 6.6 非关系型数据源
- 6.7 Trino JMX连接器
- 6.8 black hole连接器
- 6.9 内存连接器
- 6.10 其他连接器
- 6.11 小结
- 第7章 高级连接器示例
- 7.1 用Phoenix连接HBase
- 7.2 键值存储连接器示例:Accumulo
- 7.3 Apache Cassandra连接器
- 7.4 流系统连接器示例:Kafka
- 7.5 文档存储连接器示例:Elasticsearch
- 7.6 Trino中的联邦查询
- 7.7 ETL和联邦查询
- 7.8 小结
- 第8章 在Trino中使用SQL
- 8.1 Trino语句
- 8.2 Trino系统表
- 8.3 catalog
- 8.4 schema
- 8.5 information schema
- 8.6 表
- 8.7 视图
- 8.8 会话信息和配置
- 8.9 数据类型
- 8.10 SELECT语句基础
- 8.11 WHERE子句
- 8.12 GROUP BY和HAVING子句
- 8.13 ORDER BY子句和LIMIT子句
- 8.14 JOIN语句
- 8.15 UNION、INTERSECT和EXCEPT子句
- 8.16 分组操作
- 8.17 WITH子句
- 8.18 子查询
- 8.19 从表中删除数据
- 8.20 小结
- 第9章 高级SQL特性
- 9.1 函数和运算符介绍
- 9.2 标量函数和运算符
- 9.3 布尔运算符
- 9.4 逻辑运算符
- 9.5 用BETWEEN语句选择范围
- 9.6 用IS (NOT) NULL检测值的存在
- 9.7 数学函数和运算符
- 9.8 三角函数
- 9.9 常数和随机函数
- 9.10 字符串函数和运算符
- 9.11 字符串和映射
- 9.12 Unicode
- 9.13 正则表达式
- 9.14 解嵌套复杂数据类型
- 9.15 JSON函数
- 9.16 日期和时间函数及运算符
- 9.17 直方图
- 9.18 聚合函数
- 9.19 窗函数
- 9.20 lambda表达式
- 9.21 地理空间函数
- 9.22 预处理语句
- 9.23 小结
- 第三部分 Trino的实际应用
- 第10章 安全
- 10.1 认证
- 10.2 授权
- 10.3 加密
- 10.4 CA与自签名证书
- 10.5 证书认证
- 10.6 Kerberos
- 10.7 数据源访问和安全配置
- 10.8 使用Hive连接器进行Kerberos认证
- 10.9 集群分离
- 10.10 小结
- 第11章 将Trino与其他工具集成
- 11.1 使用Apache Superset进行查询、可视化和更多操作
- 11.2 使用RubiX提高性能
- 11.3 使用Apache Airflow的工作流
- 11.4 嵌入式Trino示例:Amazon Athena
- 11.5 企业版:Starburst Enterprise和StarburstGalaxy
- 11.6 其他集成示例
- 11.7 自定义集成
- 11.8 小结
- 第12章 生产环境中的Trino
- 12.1 使用Trino Web UI进行监控
- 12.2 Trino SQL查询调优
- 12.3 内存管理
- 12.4 任务并发性
- 12.5 工作节点调度
- 12.6 网络数据交换
- 12.7 JVM调优
- 12.8 资源组
- 12.9 小结
- 第13章 真实世界案例
- 13.1 部署和运行时平台
- 13.2 集群规模
- 13.3 Hadoop/Hive迁移的使用场景
- 13.4 其他数据源
- 13.5 用户和流量
- 13.6 小结
- 总结
- 关于作者
- 关于封面
- 推荐阅读
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。