展开全部

主编推荐语

一本通过分析ClickHouse底层引擎架构来解读ClickHouse极致性能的底层逻辑的著作。

内容简介

全书一共12章,分为两个部分:

第1部分(第1-7章):简要地介绍了数据仓库的核心技术和思路,系统讲解了ClickHouse的查询性能优势、适用场景、架构设计和运作过程,深入地剖析了ClickHouse的存储引擎架构、计算引擎架构以及决定ClickHouse性能的关键因素,还将ClickHouse与其他数仓架构进行了深度对比,不仅阐明了ClickHouse查询速度快的底层逻辑,也推导出了ClickHouse的适用场景。

第2部分(第8-12章):针对ClickHouse的适用场景,讲解了它的各种使用技巧以及存算分离架构、分布式架构等云计算时代的全新架构,更重要的是,从数据结构、内存、磁盘、网络、CPU、查询等方面全面总结了ClickHouse的性能优化方法和原则。

目录

  • 版权信息
  • Praise 赞誉
  • Foreword 序1
  • Foreword 序2
  • 自序 Foreword
  • 前言 Preface
  • Part 1 第一部分 架构篇
  • Chapter 1 第1章 数据仓库的核心技术
  • 1.1 OLAP和OLTP的本质区别
  • 1.2 典型大数据数仓技术及其核心思路
  • 1.3 传统数仓的缺陷
  • 1.4 ClickHouse查询性能的优势
  • 1.5 本章小结
  • Chapter 2 第2章 ClickHouse简介
  • 2.1 ClickHouse的4个标签
  • 2.2 ClickHouse的3个适用场景
  • 2.3 本章小结
  • Chapter 3 第3章 ClickHouse架构概览
  • 3.1 ClickHouse架构简介
  • 3.2 ClickHouse的核心抽象
  • 3.3 ClickHouse的运作过程
  • 3.4 本章小结
  • Chapter 4 第4章 MergeTree存储引擎架构
  • 4.1 MergeTree存储引擎的三大特点
  • 4.2 MergeTree的数据组织
  • 4.3 MergeTree的文件组织
  • 4.4 索引
  • 4.5 与事务数据库存储引擎的对比
  • 4.6 存储引擎如何影响查询速度
  • 4.7 MergeTree存储引擎的工作过程
  • 4.8 本章小结
  • Chapter 5 第5章 ClickHouse计算引擎架构
  • 5.1 ClickHouse计算引擎的架构简介与设计思想
  • 5.2 火山模型
  • 5.3 向量化引擎
  • 5.4 计算引擎如何影响查询速度
  • 5.5 本章小结
  • Chapter 6 第6章 ClickHouse与其他数仓架构的对比
  • 6.1 ClickHouse与Hive的对比
  • 6.2 ClickHouse与HBase的对比
  • 6.3 ClickHouse与Kylin的对比
  • 6.4 本章小结
  • Chapter 7 第7章 深度思考:决定外在能力的因素
  • 7.1 从架构层面分析ClickHouse
  • 7.2 结构决定功能
  • 7.3 从ClickHouse的设计来理解
  • 7.4 本章小结
  • Part 2 第二部分 实战篇
  • Chapter 8 第8章 ClickHouse使用技巧
  • 8.1 数据导入、导出技巧
  • 8.2 建表技巧
  • 8.3 高级技巧
  • 8.4 常见报错及处理方法
  • 8.5 本章小结
  • Chapter 9 第9章 ClickHouse实现用户画像系统
  • 9.1 用户画像概述
  • 9.2 用户画像系统的关键技术实现
  • 9.3 基于ClickHouse的用户画像系统的优点
  • 9.4 本章小结
  • Chapter 10 第10章 ClickHouse的存算分离架构
  • 10.1 存算分离架构背景
  • 10.2 ClickHouse中的存算分离
  • 10.3 存算分离架构给ClickHouse带来的优势
  • 10.4 本章小结
  • Chapter 11 第11章 ClickHouse的分布式架构
  • 11.1 架构特点及对比
  • 11.2 基本概念
  • 11.3 ClickHouse的复制表引擎
  • 11.4 ClickHouse分布式表引擎
  • 11.5 本章小结
  • Chapter 12 第12章 ClickHouse性能优化
  • 12.1 性能优化的原则
  • 12.2 数据结构优化
  • 12.3 内存优化
  • 12.4 磁盘优化
  • 12.5 网络优化
  • 12.6 CPU优化
  • 12.7 查询优化
  • 12.8 数据迁移优化
  • 12.9 本章小结
展开全部

评分及书评

5.0
6个评分
  • 用户头像
    给这本书评了
    5.0

    这本书不仅让我对 clickhouse 有了更深刻地认识,也启发了我形成数据清洗和数据存储的新方案。对于数据清洗,我可以用 greenplum ODS 层,用 greenplum 外部表写入 clickhouse,不需要借助 flink。对于数据存储,我可以用云对象存储保存冷数据和非结构化数据,绕过 hadoop

      1
      评论

    出版方

    机械工业出版社

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。