计算机
类型
可以朗读
语音朗读
221千字
字数
2022-09-01
发行日期
展开全部
主编推荐语
本书以精练的语言介绍了HBase的基础知识。
内容简介
本书以当前稳定版HBase 2.4.9为基础,将Hadoop升级到2.10.1版本,并对客户端API进行升级。
书中深入分析了HBase的核心思想(如数据读取和数据备份等)和HBase架构(如B+树、LSM 树和WAL等),专注于HBase在线实时系统的调优,使HBase集群响应延迟更低,让有经验的HBase开发人员能循序渐进地理解HBase源代码,更好地调试和解决各种实际问题;本书从企业常见的“用户行为日志管理系统”着手,结合HBase的实际应用场景,让读者快速上手,真正做到从入门到实践。
目录
- 版权信息
- 内容提要
- 对本书的赞誉
- 前言
- 资源与支持
- 第1章 HBase简介
- 1.1 背景
- 1.2 NoSQL与传统RDBMS
- 1.3 应用场景
- 1.3.1 Facebook用户交互
- 1.3.2 淘宝TLog
- 1.3.3 小米云服务
- 1.3.4 用户行为数据存储
- 第2章 HBase安装
- 2.1 单机部署
- 2.1.1 前置条件
- 2.1.2 下载HBase
- 2.1.3 配置HBase
- 2.1.4 启动HBase
- 2.1.5 HBase初体验
- 2.2 分布式部署
- 2.2.1 环境准备
- 2.2.2 ZooKeeper安装
- 2.2.3 Hadoop安装
- 2.2.4 HBase安装
- 2.2.5 启动集群
- 2.3 集群增删节点
- 2.3.1 增加节点
- 2.3.2 删除节点
- 第3章 HBase的数据模型
- 3.1 逻辑模型
- 3.2 物理模型
- 第4章 HBase Shell
- 4.1 数据定义语言
- 4.1.1 创建表
- 4.1.2 查看所有表
- 4.1.3 查看已创建的表
- 4.1.4 修改表
- 4.2 数据操纵语言
- 4.2.1 put命令
- 4.2.2 get命令
- 4.2.3 scan命令
- 4.2.4 delete命令、deleteall命令和truncate命令
- 4.3 其他常用的Shell命令
- 4.3.1 复制状态查看
- 4.3.2 分区拆分
- 4.3.3 分区大合并
- 4.3.4 负载均衡开关
- 4.3.5 分区手动迁移
- 4.3.6 HBase运行Ruby脚本
- 第5章 模式设计
- 5.1 行键设计
- 5.2 规避热点区间
- 5.3 高表与宽表
- 5.4 微信朋友圈设计
- 5.4.1 需求定义
- 5.4.2 问题建模
- 第6章 客户端API
- 6.1 Java客户端使用
- 6.2 数据定义语言
- 6.2.1 表管理
- 6.2.2 分区管理
- 6.3 数据操纵语言
- 6.3.1 Put操作
- 6.3.2 Get操作
- 6.3.3 Scan操作
- 6.3.4 Delete操作
- 6.3.5 Increment操作
- 6.4 过滤器
- 6.4.1 过滤器简介
- 6.4.2 过滤器使用
- 6.5 事务
- 6.5.1 原子性
- 6.5.2 隔离性
- 第7章 架构实现
- 7.1 存储
- 7.1.1 B+树
- 7.1.2 LSM树
- 7.1.3 预写入日志
- 7.2 数据写入与读取
- 7.2.1 定位分区服务器
- 7.2.2 数据修改流程
- 7.2.3 数据查询流程
- 7.3 合并策略
- 7.3.1 StripeCompaction策略
- 7.3.2 DateTieredCompaction策略
- 7.3.3 RatioBasedCompaction策略
- 7.3.4 ExploringCompaction策略
- 7.3.5 FIFOCompaction策略
- 第8章 协处理器
- 8.1 观察者类型协处理器
- 8.2 端点类型协处理器
- 8.3 加载/卸载协处理器
- 8.3.1 静态加载/卸载
- 8.3.2 动态加载/卸载
- 第9章 HBase性能调优
- 9.1 客户端调优
- 9.1.1 设置客户端写入缓存
- 9.1.2 设置合适的扫描缓存
- 9.1.3 跳过WAL写入
- 9.1.4 设置重试次数与间隔
- 9.1.5 选用合适的过滤器
- 9.2 服务器端调优
- 9.2.1 创建表语句的优化
- 9.2.2 禁止分区自动拆分与合并
- 9.2.3 开启机柜感知
- 9.2.4 开启短路本地读
- 9.2.5 开启补偿重试读
- 9.2.6 JVM内存调优
- 第10章 集群间数据复制
- 10.1 复制
- 10.1.1 集群拓扑
- 10.1.2 配置集群复制
- 10.1.3 验证复制数据
- 10.1.4 复制详解
- 10.2 快照
- 10.2.1 配置快照
- 10.2.2 管理快照
- 10.3 导出和导入
- 10.3.1 导出
- 10.3.2 导入
- 10.4 复制表
- 第11章 监控
- 11.1 Hadoop监控
- 11.1.1 Web监控页面
- 11.1.2 JMX监控接口
- 11.2 HBase监控
- 11.2.1 Web监控页面
- 11.2.2 JMX监控接口
- 11.2.3 客户端API监控
- 附录A 常见问题
- A.1 垃圾回收超时导致分区服务器宕机
- A.2 Scanner租期过期
- A.3 分区迁移异常
- A.4 Windows运行HBase程序缺少winutil.exe
- A.5 误删表数据
- A.6 RIT时间过长导致不同分区行键数据有重叠
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。