科技
类型
可以朗读
语音朗读
247千字
字数
2018-12-01
发行日期
展开全部
主编推荐语
大数据时代快速上手HBase行动指南。
内容简介
本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase,对HBase的核心思想(如数据读取、数据备份等)和HBase架构(如LSM树、WAL)有深入的分析,并且让有经验的HBase开发人员也能够循序渐进地深入理解HBase源码,以便更好地去调试和解决线上遇到的各种问题。
本书更加专注于HBase在线实时系统的调优,使HBase集群响应延迟更低。
本书结合企业必备的“用户行为分析系统”,让读者能够快速上手的同时,也不乏企业HBase实际应用场景,理论不脱离实际,真正做到从入门到精通。
本书适合有一定Java基础的程序员作为HBase入门教程,HBase运维人员可以将本书作为参考手册来部署和监控HBase,正在将HBase应用到在线生产环境中的软件开发人员也可以参考本书来调优HBase在线集群性能。
目录
- 版权信息
- 内容提要
- 对本书的赞誉
- 前言
- 资源与支持
- 第1章 HBase简介
- 1.1 背景
- 1.2 NoSQL与传统RDBMS
- 1.3 应用场景
- 1.3.1 Facebook用户交互数据
- 1.3.2 淘宝TLog等
- 1.3.3 小米云服务
- 1.3.4 用户行为数据存储
- 第2章 HBase安装
- 2.1 单机部署
- 2.1.1 前置条件
- 2.1.2 下载HBase
- 2.1.3 配置HBase
- 2.1.4 启动HBase
- 2.1.5 HBase初体验
- 2.2 分布式部署
- 2.2.1 环境准备
- 2.2.2 ZooKeeper安装
- 2.2.3 Hadoop安装
- 2.2.4 HBase安装
- 2.2.5 启动集群
- 2.3 集群增删节点
- 2.3.1 增加节点
- 2.3.2 删除节点
- 第3章 HBase数据模型
- 3.1 逻辑模型
- 3.2 物理模型
- 第4章 HBase shell
- 4.1 数据定义语言
- 4.1.1 创建表
- 4.1.2 查看所有表
- 4.1.3 查看建表
- 4.1.4 修改表
- 4.2 数据操纵语言
- 4.2.1 Put
- 4.2.2 Get
- 4.2.3 Scan
- 4.2.4 删除数据
- 4.3 其他常用shell
- 4.3.1 复制状态查看
- 4.3.2 分区拆分
- 4.3.3 分区主压缩
- 4.3.4 负载均衡开关
- 4.3.5 分区手动迁移
- 第5章 模式设计
- 5.1 行键设计
- 5.2 规避热点区间
- 5.3 高表与宽表
- 5.4 微信朋友圈设计
- 5.4.1 需求定义
- 5.4.2 问题建模
- 第6章 客户端API
- 6.1 Java客户端使用
- 6.2 数据定义语言
- 6.2.1 表管理
- 6.2.2 分区管理
- 6.3 数据操纵语言
- 6.3.1 Put
- 6.3.2 Get
- 6.3.3 Scan
- 6.3.4 Delete
- 6.3.5 Increment
- 6.4 过滤器
- 6.4.1 过滤器简介
- 6.4.2 过滤器使用
- 6.5 事务
- 6.5.1 原子性
- 6.5.2 隔离性
- 第7章 架构实现
- 7.1 存储
- 7.1.1 B+树
- 7.1.2 LSM树
- 7.1.3 WAL
- 7.2 数据写入读取
- 7.2.1 定位分区服务器
- 7.2.2 数据修改流程
- 7.2.3 数据查询流程
- 第8章 协处理器
- 8.1 观察者类型协处理器
- 8.2 端点类型协处理器
- 8.3 装载/卸载协处理器
- 8.3.1 静态装载/卸载
- 8.3.2 动态装载/卸载
- 第9章 HBase性能调优
- 9.1 客户端调优
- 9.1.1 设置客户端写入缓存
- 9.1.2 设置合适的扫描缓存
- 9.1.3 跳过WAL写入
- 9.1.4 设置重试次数与间隔
- 9.1.5 选用合适的过滤器
- 9.2 服务端调优
- 9.2.1 建表DDL优化
- 9.2.2 禁止分区自动拆分与压缩
- 9.2.3 开启机柜感知
- 9.2.4 开启Short Circuit Local Reads
- 9.2.5 开启补偿重试读
- 9.2.6 JVM内存调优
- 第10章 集群间数据复制
- 10.1 复制
- 10.1.1 集群拓扑
- 10.1.2 配置集群复制
- 10.1.3 验证复制数据
- 10.1.4 复制详解
- 10.2 快照
- 10.2.1 配置快照
- 10.2.2 管理快照
- 10.3 导出和导入
- 10.3.1 导出
- 10.3.2 导入
- 10.4 复制表
- 第11章 监控
- 11.1 Hadoop监控
- 11.1.1 Web监控页面
- 11.1.2 JMX监控
- 11.2 HBase监控
- 11.2.1 Web监控页面
- 11.2.2 JMX监控
- 11.2.3 API监控
- 后记
- 附录 常见问题
- A.1 GC时间超长导致分区服务器宕机
- A.2 Scanner租期过期
- A.3 分区迁移异常
- A.4 Windows运行HBase程序缺少winutil.exe
- A.5 误删表数据
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。