《Spark SQL内核剖析》电子书在线阅读-朱锋-得到APP

计算机类型

7.8 豆瓣评分

可以朗读语音朗读

229千字字数

2018-07-01 发行日期

展开全部

主编推荐语

聚焦Spark SQL系统，剖析架构及技术实现，分享开发案例与优化经验。

内容简介

经过多年的发展，大数据处理技术逐步成熟。作为业界大数据计算的事实标准，Apache Spark系统已经广泛应用于各大企业与研究机构，并形成完整的生态系统。Spark系统包含了SQL、GraphX和R等各个子系统以支持不同业务领域的需求。作为传统关系数据库/数据仓库在大数据场景下的解决方案，Spark SQL已经成为了业界的重要选择方案，同时也成为了Spark开源社区中最为活跃的部分。本书聚焦于Spark SQL系统，对其整体架构、内部各个模块的技术实现机制进行源码级别的剖析，涉及到SQL编译、逻辑计划、物理执行计划、重要查询（如Aggregation与Join等）的技术细节。此外，本书内容上还会结合生产环境的海量应用，分享大量真实开发案例与实践优化经验。

评分及书评

评分不足

1个评分

念兹在兹
2023-09-10

给这本书评了

3.0

有参考意义，排版有些问题

涉及 sparksql 底层源码，有参考意义，尤其最后讲到腾讯内部的一些优化实践，有很大的启发。主要就是排版有些问题，有些英文是分开的，然后划线或记笔记的话会出现画不准（尤其是在电脑端）的现象。希望出版方能够及时订正
转发
转发同时评论

快速转发

评论

赞

分享
「微信」扫码分享

出版方

电子工业出版社

电子工业出版社成立于1982年10月，是国务院独资、工信部直属的中央级科技与教育出版社，是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展，已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域，综合出版能力位居全国出版行业前列。