展开全部

主编推荐语

本书以精练的语言介绍了HBase的基础知识。

内容简介

本书以当前稳定版HBase 2.4.9为基础,将Hadoop升级到2.10.1版本,并对客户端API进行升级。

书中深入分析了HBase的核心思想(如数据读取和数据备份等)和HBase架构(如B+树、LSM 树和WAL等),专注于HBase在线实时系统的调优,使HBase集群响应延迟更低,让有经验的HBase开发人员能循序渐进地理解HBase源代码,更好地调试和解决各种实际问题;本书从企业常见的“用户行为日志管理系统”着手,结合HBase的实际应用场景,让读者快速上手,真正做到从入门到实践。

目录

  • 版权信息
  • 内容提要
  • 对本书的赞誉
  • 前言
  • 资源与支持
  • 第1章 HBase简介
  • 1.1 背景
  • 1.2 NoSQL与传统RDBMS
  • 1.3 应用场景
  • 1.3.1 Facebook用户交互
  • 1.3.2 淘宝TLog
  • 1.3.3 小米云服务
  • 1.3.4 用户行为数据存储
  • 第2章 HBase安装
  • 2.1 单机部署
  • 2.1.1 前置条件
  • 2.1.2 下载HBase
  • 2.1.3 配置HBase
  • 2.1.4 启动HBase
  • 2.1.5 HBase初体验
  • 2.2 分布式部署
  • 2.2.1 环境准备
  • 2.2.2 ZooKeeper安装
  • 2.2.3 Hadoop安装
  • 2.2.4 HBase安装
  • 2.2.5 启动集群
  • 2.3 集群增删节点
  • 2.3.1 增加节点
  • 2.3.2 删除节点
  • 第3章 HBase的数据模型
  • 3.1 逻辑模型
  • 3.2 物理模型
  • 第4章 HBase Shell
  • 4.1 数据定义语言
  • 4.1.1 创建表
  • 4.1.2 查看所有表
  • 4.1.3 查看已创建的表
  • 4.1.4 修改表
  • 4.2 数据操纵语言
  • 4.2.1 put命令
  • 4.2.2 get命令
  • 4.2.3 scan命令
  • 4.2.4 delete命令、deleteall命令和truncate命令
  • 4.3 其他常用的Shell命令
  • 4.3.1 复制状态查看
  • 4.3.2 分区拆分
  • 4.3.3 分区大合并
  • 4.3.4 负载均衡开关
  • 4.3.5 分区手动迁移
  • 4.3.6 HBase运行Ruby脚本
  • 第5章 模式设计
  • 5.1 行键设计
  • 5.2 规避热点区间
  • 5.3 高表与宽表
  • 5.4 微信朋友圈设计
  • 5.4.1 需求定义
  • 5.4.2 问题建模
  • 第6章 客户端API
  • 6.1 Java客户端使用
  • 6.2 数据定义语言
  • 6.2.1 表管理
  • 6.2.2 分区管理
  • 6.3 数据操纵语言
  • 6.3.1 Put操作
  • 6.3.2 Get操作
  • 6.3.3 Scan操作
  • 6.3.4 Delete操作
  • 6.3.5 Increment操作
  • 6.4 过滤器
  • 6.4.1 过滤器简介
  • 6.4.2 过滤器使用
  • 6.5 事务
  • 6.5.1 原子性
  • 6.5.2 隔离性
  • 第7章 架构实现
  • 7.1 存储
  • 7.1.1 B+树
  • 7.1.2 LSM树
  • 7.1.3 预写入日志
  • 7.2 数据写入与读取
  • 7.2.1 定位分区服务器
  • 7.2.2 数据修改流程
  • 7.2.3 数据查询流程
  • 7.3 合并策略
  • 7.3.1 StripeCompaction策略
  • 7.3.2 DateTieredCompaction策略
  • 7.3.3 RatioBasedCompaction策略
  • 7.3.4 ExploringCompaction策略
  • 7.3.5 FIFOCompaction策略
  • 第8章 协处理器
  • 8.1 观察者类型协处理器
  • 8.2 端点类型协处理器
  • 8.3 加载/卸载协处理器
  • 8.3.1 静态加载/卸载
  • 8.3.2 动态加载/卸载
  • 第9章 HBase性能调优
  • 9.1 客户端调优
  • 9.1.1 设置客户端写入缓存
  • 9.1.2 设置合适的扫描缓存
  • 9.1.3 跳过WAL写入
  • 9.1.4 设置重试次数与间隔
  • 9.1.5 选用合适的过滤器
  • 9.2 服务器端调优
  • 9.2.1 创建表语句的优化
  • 9.2.2 禁止分区自动拆分与合并
  • 9.2.3 开启机柜感知
  • 9.2.4 开启短路本地读
  • 9.2.5 开启补偿重试读
  • 9.2.6 JVM内存调优
  • 第10章 集群间数据复制
  • 10.1 复制
  • 10.1.1 集群拓扑
  • 10.1.2 配置集群复制
  • 10.1.3 验证复制数据
  • 10.1.4 复制详解
  • 10.2 快照
  • 10.2.1 配置快照
  • 10.2.2 管理快照
  • 10.3 导出和导入
  • 10.3.1 导出
  • 10.3.2 导入
  • 10.4 复制表
  • 第11章 监控
  • 11.1 Hadoop监控
  • 11.1.1 Web监控页面
  • 11.1.2 JMX监控接口
  • 11.2 HBase监控
  • 11.2.1 Web监控页面
  • 11.2.2 JMX监控接口
  • 11.2.3 客户端API监控
  • 附录A 常见问题
  • A.1 垃圾回收超时导致分区服务器宕机
  • A.2 Scanner租期过期
  • A.3 分区迁移异常
  • A.4 Windows运行HBase程序缺少winutil.exe
  • A.5 误删表数据
  • A.6 RIT时间过长导致不同分区行键数据有重叠
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。