vlambda博客
学习文章列表

【第7期】深入HBase内核,剖析HBase数据库的基础理论与开发运维



Apache HBase是基于Apache Hadoop构建的一个高可用、高性能、多版本的分布式NoSQL数据库,是Google BigTable的开源实现,通过在廉价服务器上搭建大规模结构化存储集群,提供海量数据高性能的随机读写能力。

 

HBase项目自2006年提交第一行代码以来,经历了13年的蓬勃发展。现在已经有大量企业采用HBase来存储和分析飞速增长的业务数据。

 

从全球范围来看,国内HBase的关注度更是高居榜首,这得益于国内互联网、移动互联网、物联网等领域庞大的数据体量。诸多国内大型科技公司,如阿里巴巴、小米、腾讯、网易、华为、滴滴、快手、中国移动等,都已经把HBase作为极重要的基础设施,很多公司对HBase社区也有长期的投入。

 

本期赠书《HBase原理与实践》,本书从设计的角度对HBase的整个体系架构和各核心组件进行系统的分析和讲解。与此同时,还介绍常用的性能调优策略以及问题诊断的方法和技巧,帮助读者更好地在实际生产环境中实践。另外,本书最后章节集中介绍HBase 2.x版本的核心特性,例如Procedure v2In Memory Compaction以及MOB等。


【第7期】深入HBase内核,剖析HBase数据库的基础理论与开发运维

 

本书不是一本入门级读物,本书面向那些使用HBase作为数据库后端存储的应用程序开发者、有一定经验的运维人员和对HBase内核设计感兴趣的人。

 

如果你想深入了解HBase的每个组件是如何工作的,如果你想更好地运维或者调优你的HBase集群,如果你想了解HBase 2.x版本的核心特性,就请阅读本书。想要更好地阅读本书,需要具备如下先决条件:

 

  • 了解HBase的基本操作。

  • 了解C、Java等高级语言。

  • 对一些基本算法有所了解,因为本书会从源代码层面分析HBase的工作机制,如果你能了解这些算法,会使你更深入地理解HBase


本书共有16章,可以分为6个部分。

  • 第一部分:HBase基础部分,包含第12章。其中,第1章主要介绍HBase系统的发展历史、数据模型以及体系结构,第2章主要介绍HBase系统中常用的数据结构以及基础算法。

  • 第二部分:HBase系统相关组件,包含第345章。其中,第3章重点介绍HBase所依赖的核心组件,包括ZooKeeperHDFS等,第4章介绍HBase客户端组件实现,第5章介绍RegionServer内部组件的实现。

  • 第三部分:HBase核心工作原理,包含第67891011章。其中,第6章详细分析HBase读写流程,第7章介绍HBase Compaction的实现原理,第8章介绍HBaseRegion的迁移、合并以及分裂等操作是如何实现的,第9章介绍RegionServer宕机后如何通过HLog进行数据恢复,第10章介绍HBase不同集群之间的复制是如何实现的,第11章介绍HBase如何通过Snapshot机制完成数据的备份和恢复。

  • 第四部分:HBase运维调优实践,包含第121314章。其中,第12章介绍HBase集群常用的运维管理操作,包括集群如何有效监控,基准性能如何测试等,第13章集中介绍HBase集群的常用调优技巧,第14章重点分析几个HBase实际运维案例,通过案例分析介绍HBase集群定位和处理问题的技巧。

  • 第五部分:HBase 2.x核心特性(第15章),介绍HBase最新2.x版本的核心功能与特性。

  • 第六部分:HBase高级话题(第16章),介绍社区中比较热门的二级索引话题,以及HBase内核的开发与测试。


本书的六个部分都是相互独立的话题,读者完全可以从书中任何一个部分开始阅读。


点击链接了解详情并购买






第006期赠书活动中奖名单公布

【第7期】深入HBase内核,剖析HBase数据库的基础理论与开发运维



【第7期】深入HBase内核,剖析HBase数据库的基础理论与开发运维



留言赠书

送书规则:华章图书,专注高端IT出版。感谢大家对华章图书的信任与支持。留言谈谈你想要本书的理由。留言点赞数最多的前2名,小编会包邮分别送出1本正版书籍。

截止日期:6月5日下午17:00

特别注意:1、常读用户优先 。2、每人每月至多可参与2次。




更多 精彩 回顾




书讯 | 
上新 | 
书单 | 
干货 | 
收藏 |