展开全部

主编推荐语

大数据时代快速上手HBase行动指南。

内容简介

本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。

本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。

本书结合企业必备的“用户行为分析系统”,让读者能够快速上手的同时,也不乏企业HBase实际应用场景,理论不脱离实际,真正做到从入门到精通。

本书适合有一定Java基础的程序员作为HBase入门教程,HBase运维人员可以将本书作为参考手册来部署和监控HBase,正在将HBase应用到在线生产环境中的软件开发人员也可以参考本书来调优HBase在线集群性能。

目录

  • 版权信息
  • 内容提要
  • 对本书的赞誉
  • 前言
  • 资源与支持
  • 第1章 HBase简介
  • 1.1 背景
  • 1.2 NoSQL与传统RDBMS
  • 1.3 应用场景
  • 1.3.1 Facebook用户交互数据
  • 1.3.2 淘宝TLog等
  • 1.3.3 小米云服务
  • 1.3.4 用户行为数据存储
  • 第2章 HBase安装
  • 2.1 单机部署
  • 2.1.1 前置条件
  • 2.1.2 下载HBase
  • 2.1.3 配置HBase
  • 2.1.4 启动HBase
  • 2.1.5 HBase初体验
  • 2.2 分布式部署
  • 2.2.1 环境准备
  • 2.2.2 ZooKeeper安装
  • 2.2.3 Hadoop安装
  • 2.2.4 HBase安装
  • 2.2.5 启动集群
  • 2.3 集群增删节点
  • 2.3.1 增加节点
  • 2.3.2 删除节点
  • 第3章 HBase数据模型
  • 3.1 逻辑模型
  • 3.2 物理模型
  • 第4章 HBase shell
  • 4.1 数据定义语言
  • 4.1.1 创建表
  • 4.1.2 查看所有表
  • 4.1.3 查看建表
  • 4.1.4 修改表
  • 4.2 数据操纵语言
  • 4.2.1 Put
  • 4.2.2 Get
  • 4.2.3 Scan
  • 4.2.4 删除数据
  • 4.3 其他常用shell
  • 4.3.1 复制状态查看
  • 4.3.2 分区拆分
  • 4.3.3 分区主压缩
  • 4.3.4 负载均衡开关
  • 4.3.5 分区手动迁移
  • 第5章 模式设计
  • 5.1 行键设计
  • 5.2 规避热点区间
  • 5.3 高表与宽表
  • 5.4 微信朋友圈设计
  • 5.4.1 需求定义
  • 5.4.2 问题建模
  • 第6章 客户端API
  • 6.1 Java客户端使用
  • 6.2 数据定义语言
  • 6.2.1 表管理
  • 6.2.2 分区管理
  • 6.3 数据操纵语言
  • 6.3.1 Put
  • 6.3.2 Get
  • 6.3.3 Scan
  • 6.3.4 Delete
  • 6.3.5 Increment
  • 6.4 过滤器
  • 6.4.1 过滤器简介
  • 6.4.2 过滤器使用
  • 6.5 事务
  • 6.5.1 原子性
  • 6.5.2 隔离性
  • 第7章 架构实现
  • 7.1 存储
  • 7.1.1 B+树
  • 7.1.2 LSM树
  • 7.1.3 WAL
  • 7.2 数据写入读取
  • 7.2.1 定位分区服务器
  • 7.2.2 数据修改流程
  • 7.2.3 数据查询流程
  • 第8章 协处理器
  • 8.1 观察者类型协处理器
  • 8.2 端点类型协处理器
  • 8.3 装载/卸载协处理器
  • 8.3.1 静态装载/卸载
  • 8.3.2 动态装载/卸载
  • 第9章 HBase性能调优
  • 9.1 客户端调优
  • 9.1.1 设置客户端写入缓存
  • 9.1.2 设置合适的扫描缓存
  • 9.1.3 跳过WAL写入
  • 9.1.4 设置重试次数与间隔
  • 9.1.5 选用合适的过滤器
  • 9.2 服务端调优
  • 9.2.1 建表DDL优化
  • 9.2.2 禁止分区自动拆分与压缩
  • 9.2.3 开启机柜感知
  • 9.2.4 开启Short Circuit Local Reads
  • 9.2.5 开启补偿重试读
  • 9.2.6 JVM内存调优
  • 第10章 集群间数据复制
  • 10.1 复制
  • 10.1.1 集群拓扑
  • 10.1.2 配置集群复制
  • 10.1.3 验证复制数据
  • 10.1.4 复制详解
  • 10.2 快照
  • 10.2.1 配置快照
  • 10.2.2 管理快照
  • 10.3 导出和导入
  • 10.3.1 导出
  • 10.3.2 导入
  • 10.4 复制表
  • 第11章 监控
  • 11.1 Hadoop监控
  • 11.1.1 Web监控页面
  • 11.1.2 JMX监控
  • 11.2 HBase监控
  • 11.2.1 Web监控页面
  • 11.2.2 JMX监控
  • 11.2.3 API监控
  • 后记
  • 附录 常见问题
  • A.1 GC时间超长导致分区服务器宕机
  • A.2 Scanner租期过期
  • A.3 分区迁移异常
  • A.4 Windows运行HBase程序缺少winutil.exe
  • A.5 误删表数据
展开全部

评分及书评

评分不足
1个评分
  • 用户头像
    给这本书评了
    5.0

    本书以精练的语言介绍 HBase 的基础知识,让初学者能够快速上手使用 HBase,对 HBase 的核心思想(如数据读取、数据备份等)和 HBase 架构(如 LSM 树、WAL)有深入的分析,并且让有经验的 HBase 开发人员也能够循序渐进地深入理解 HBase 源码,以便更好地去调试和解决线上遇到的各种问题。本书更加专注于 HBase 在线实时系统的调优,使 HBase 集群响应延迟更低。

      转发
      评论

    出版方

    人民邮电出版社

    人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。