互联网
类型
可以朗读
语音朗读
90千字
字数
2023-11-01
发行日期
展开全部
主编推荐语
系统介绍HBase基本原理与运行机制。
内容简介
全书共分为11章,主要内容包括:HBase的体系结构和系统特性、HBase的基础数据结构与算法、RegionServer的核心模块、HBase的读写流程、Compaction实现原理和使用策略、负载均衡的实现与应用、HBase的基础指令(包括DDL指令、DML指令、命名空间指令等)、如何使用Java语言操作HBase等。
本书适用于以前没有接触过HBase,或者对HBase有所了解并希望深入学习的读者。同时,也适用于HBase应用开发人员和系统管理人员,以及对云计算、大数据处理技术和NoSQL数据库感兴趣的技术人员作为参考书。
目录
- 版权信息
- 内容简介
- 前言
- 第1章 初识HBase
- 1.1 HBase的发展历程
- 1.2 HBase的特征
- 1.3 HBase的优缺点
- 1.3.1 HBase的优点
- 1.3.2 HBase的缺点
- 1.4 HBase与关系数据库的区别
- 1.5 使用HBase的时机
- 1.6 HBase的应用场景
- 1.7 HBase的数据模型
- 1.8 HBase的逻辑视图
- 1.9 本章练习
- 第2章 让HBase运行起来
- 2.1 HBase基本架构
- 2.2 HBase分布式环境搭建
- 2.2.1 设置服务器名称
- 2.2.2 Hadoop单机安装
- 2.2.3 Hadoop集群安装
- 2.2.4 ZooKeeper集群安装
- 2.2.5 HBase集群安装
- 2.3 使用容器化技术搭建HBase
- 2.3.1 在CentOS环境下安装Docker
- 2.3.2 在Windows 10环境下安装Docker
- 2.3.3 利用Docker安装HBase
- 2.4 HBase快速入门
- 2.4.1 使用HBase Shell
- 2.4.2 使用create命令
- 2.4.3 使用alter命令
- 2.4.4 使用list命令
- 2.4.5 使用describe命令
- 2.4.6 使用put命令
- 2.4.7 使用get命令
- 2.4.8 使用scan命令
- 2.4.9 使用deleteall命令
- 2.5 本章练习
- 第3章 HBase基础操作
- 3.1 help命令
- 3.2 常规命令
- 3.2.1 查询集群状态信息(status命令)
- 3.2.2 查看如何操作表(table_help命令)
- 3.2.3 查询HBase的版本信息(version命令)
- 3.2.4 查看当前用户(whoami命令)
- 3.2.5 查看进程列表(processlist命令)
- 3.3 DDL命令
- 3.3.1 创建表(create命令)
- 3.3.2 修改表信息(alter命令)
- 3.3.3 异步修改表信息(alter_async命令)
- 3.3.4 获取表的详细信息(describe命令)
- 3.3.5 获取HBase中所有的表(list命令)
- 3.3.6 判断表是否存在(exists命令)
- 3.3.7 以对象的方式操作表(get_table命令)
- 3.3.8 启用表(enable命令)
- 3.3.9 启用所有满足正则表达式的表(enable_all命令)
- 3.3.10 判断表是否被启用(is_enabled命令)
- 3.3.11 禁用表(disable命令)
- 3.3.12 禁用所有满足正则表达式的表(disable_all命令)
- 3.3.13 判断表是否被禁用(is_disabled命令)
- 3.3.14 删除表(drop命令)
- 3.3.15 删除所有满足正则表达式的表(drop_all命令)
- 3.3.16 获取RowKey所在的区域(locate_region命令)
- 3.3.17 显示HBase支持的过滤器(show_filters命令)
- 3.4 命名空间
- 3.4.1 创建命名空间(create_namespace命令)
- 3.4.2 修改命名空间(alter_namespace命令)
- 3.4.3 获取命名空间详情(describe_namespace命令)
- 3.4.4 获取命名空间下所有表的名称(list_namespace_tables命令)
- 3.4.5 获取所有的命名空间(list_namespace命令)
- 3.4.6 删除命名空间(drop_namespace命令)
- 3.5 DML命令
- 3.5.1 新增或者修改数据(put命令)
- 3.5.2 全表扫描数据(scan命令)
- 3.5.3 获取表中数据的总行数(count命令)
- 3.5.4 获取表中的数据(get命令)
- 3.5.5 删除列族中的某个列(delete命令)
- 3.5.6 删除整行数据(delete命令)
- 3.5.7 列值自增(incr命令)
- 3.5.8 获取自增后的列值(get_counter命令)
- 3.5.9 获取表所对应的Region数量(get_splits命令)
- 3.5.10 清空整个表数据,不保留分区(truncat命令)
- 3.5.11 清空整个表数据,保留分区(truncat_ preserve命令)
- 3.6 本章练习
- 第4章 使用Java操作HBase
- 4.1 从HelloWorld开始
- 4.2 创建表
- 4.3 添加数据
- 4.4 批量添加数据
- 4.5 内容追加
- 4.6 修改数据
- 4.7 删除数据
- 4.8 批量删除
- 4.9 原子性操作
- 4.10 批量操作
- 4.11 自增
- 4.12 判断数据是否存在
- 4.13 代码封装
- 4.14 本章练习
- 第5章 客户端API高阶用法
- 5.1 数据查询
- 5.2 数据扫描
- 5.3 过滤器快速实战
- 5.4 RowKey过滤器
- 5.5 RowKey前缀过滤器
- 5.6 RowKey模糊过滤器
- 5.7 列族过滤器
- 5.8 列过滤器
- 5.9 多列前缀过滤器
- 5.10 首次列键过滤器
- 5.11 列键过滤器
- 5.12 列值过滤器
- 5.13 单列值过滤器
- 5.14 列值排除过滤器
- 5.15 随机行过滤器
- 5.16 分页过滤器
- 5.17 多个过滤器综合查询
- 5.18 本章练习
- 第6章 HBase数据批量加载
- 6.1 HBase批量加载简介
- 6.2 海量交易记录数据存储案例
- 6.2.1 案例开发准备工作
- 6.2.2 编写实体类
- 6.2.3 创建读取数据的Mapper类
- 6.2.4 编写驱动类
- 6.2.5 上传数据到HDFS
- 6.2.6 将导入的HDFS数据与HBase进行关联
- 6.3 本章练习
- 第7章 协处理器
- 7.1 协处理器简介
- 7.2 协处理器分类
- 7.3 Coprocessor接口
- 7.4 协处理器的加载
- 7.4.1 使用配置文件加载
- 7.4.2 从表描述器中加载
- 7.5 RegionObschmerver类
- 7.5.1 Region状态
- 7.5.2 处理客户端API事件
- 7.6 自定义Obschmerver案例
- 7.7 本章练习
- 第8章 Phoenix在HBase中的整合应用
- 8.1 Phoenix简介
- 8.2 安装Phoenix
- 8.2.1 下载
- 8.2.2 安装
- 8.3 连接Phoenix
- 8.4 Phoenix快速入门
- 8.4.1 创建表
- 8.4.2 删除表
- 8.4.3 插入数据
- 8.4.4 分页查询
- 8.5 本章练习
- 第9章 HBase架构深入剖析
- 9.1 HBase架构原理
- 9.1.1 RegionServer流程解析
- 9.1.2 StoreFile和HFile结构
- 9.1.3 MemStore和StoreFile
- 9.2 HBase的写流程
- 9.3 HBase的读流程
- 9.4 HBase如何进行增、删、改、查
- 9.5 数据刷写
- 9.5.1 刷写操作的触发时机
- 9.5.2 刷写流程
- 9.6 数据合并
- 9.7 数据拆分
- 9.8 本章练习
- 第10章 HBase的性能优化
- 10.1 表设计优化
- 10.1.1 预分区
- 10.1.2 RowKey设计优化
- 10.1.3 列族数量优化
- 10.1.4 版本优化
- 10.2 HBase提升写效率
- 10.3 MemStore调优
- 10.4 合并调优
- 10.5 WAL调优
- 10.6 HBase读取优化
- 10.7 本章练习
- 第11章 HBase数据操作实战
- 11.1 创建表并添加表数据
- 11.2 修改和删除表数据
- 11.3 批量操作表数据
- 11.4 查询数据
- 11.5 使用过滤器进行数据查询
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。