深入HBase架构解析（二）

前言

这是《深入HBase架构解析（一）》的续，不多废话，继续。。。。

HBase读的实现

通过前文的描述，我们知道在HBase写时，相同Cell(RowKey/ColumnFamily/Column相同)并不保证在一起，甚至删除一个Cell也只是写入一个新的Cell，它含有Delete标记，而不一定将一个Cell真正删除了，因而这就引起了一个问题，如何实现读的问题？要解决这个问题，我们先来分析一下相同的Cell可能存在的位置：首先对新写入的Cell，它会存在于MemStore中；然后对之前已经Flush到HDFS中的Cell，它会存在于某个或某些StoreFile(HFile)中；最后，对刚读取过的Cell，它可能存在于BlockCache中。既然相同的Cell可能存储在三个地方，在读取的时候只需要扫瞄这三个地方，然后将结果合并即可(Merge Read)，在HBase中扫瞄的顺序依次是：BlockCache、MemStore、StoreFile(HFile)。其中StoreFile的扫瞄先会使用Bloom Filter过滤那些不可能符合条件的HFile，然后使用Block Index快速定位Cell，并将其加载到BlockCache中，然后从BlockCache中读取。我们知道一个HStore可能存在多个StoreFile(HFile)，此时需要扫瞄多个HFile，如果HFile过多又是会引起性能问题。

Compaction

MemStore每次Flush会创建新的HFile，而过多的HFile会引起读的性能问题，那么如何解决这个问题呢？HBase采用Compaction机制来解决这个问题，有点类似Java中的GC机制，起初Java不停的申请内存而不释放，增加性能，然而天下没有免费的午餐，最终我们还是要在某个条件下去收集垃圾，很多时候需要Stop-The-World，这种Stop-The-World有些时候也会引起很大的问题，比如参考本人写的这篇文章，因而设计是一种权衡，没有完美的。还是类似Java中的GC，在HBase中Compaction分为两种：Minor Compaction和Major Compaction。

Minor Compaction是指选取一些小的、相邻的StoreFile将他们合并成一个更大的StoreFile，在这个过程中不会处理已经Deleted或Expired的Cell。一次Minor Compaction的结果是更少并且更大的StoreFile。（这个是对的吗？BigTable中是这样描述Minor Compaction的：As write operations execute, the size of the memtable in- creases. When the memtable size reaches a threshold, the memtable is frozen, a new memtable is created, and the frozen memtable is converted to an SSTable and written to GFS. This minor compaction process has two goals: it shrinks the memory usage of the tablet server, and it reduces the amount of data that has to be read from the commit log during recovery if this server dies. Incom- ing read and write operations can continue while com- pactions occur. 也就是说它将memtable的数据flush的一个HFile/SSTable称为一次Minor Compaction）
Major Compaction是指将所有的StoreFile合并成一个StoreFile，在这个过程中，标记为Deleted的Cell会被删除，而那些已经Expired的Cell会被丢弃，那些已经超过最多版本数的Cell会被丢弃。一次Major Compaction的结果是一个HStore只有一个StoreFile存在。Major Compaction可以手动或自动触发，然而由于它会引起很多的IO操作而引起性能问题，因而它一般会被安排在周末、凌晨等集群比较闲的时间。

更形象一点，如下面两张图分别表示Minor Compaction和Major Compaction。

HRegion Split

最初，一个Table只有一个HRegion，随着数据写入增加，如果一个HRegion到达一定的大小，就需要Split成两个HRegion，这个大小由hbase.hregion.max.filesize指定，默认为10GB。当split时，两个新的HRegion会在同一个HRegionServer中创建，它们各自包含父HRegion一半的数据，当Split完成后，父HRegion会下线，而新的两个子HRegion会向HMaster注册上线，处于负载均衡的考虑，这两个新的HRegion可能会被HMaster分配到其他的HRegionServer中。关于Split的详细信息，可以参考这篇文章：《Apache HBase Region Splitting and Merging》。

HRegion负载均衡

在HRegion Split后，两个新的HRegion最初会和之前的父HRegion在相同的HRegionServer上，出于负载均衡的考虑，HMaster可能会将其中的一个甚至两个重新分配的其他的HRegionServer中，此时会引起有些HRegionServer处理的数据在其他节点上，直到下一次Major Compaction将数据从远端的节点移动到本地节点。

HRegionServer Recovery

当一台HRegionServer宕机时，由于它不再发送Heartbeat给ZooKeeper而被监测到，此时ZooKeeper会通知HMaster，HMaster会检测到哪台HRegionServer宕机，它将宕机的HRegionServer中的HRegion重新分配给其他的HRegionServer，同时HMaster会把宕机的HRegionServer相关的WAL拆分分配给相应的HRegionServer(将拆分出的WAL文件写入对应的目的HRegionServer的WAL目录中，并并写入对应的DataNode中），从而这些HRegionServer可以Replay分到的WAL来重建MemStore。

HBase架构简单总结

在NoSQL中，存在著名的CAP理论，即Consistency、Availability、Partition Tolerance不可全得，目前市场上基本上的NoSQL都采用Partition Tolerance以实现数据得水平扩展，来处理Relational DataBase遇到的无法处理数据量太大的问题，或引起的性能问题。因而只有剩下C和A可以选择。HBase在两者之间选择了Consistency，然后使用多个HMaster以及支持HRegionServer的failure监控、ZooKeeper引入作为协调者等各种手段来解决Availability问题，然而当网络的Split-Brain(Network Partition)发生时，它还是无法完全解决Availability的问题。从这个角度上，Cassandra选择了A，即它在网络Split-Brain时还是能正常写，而使用其他技术来解决Consistency的问题，如读的时候触发Consistency判断和处理。这是设计上的限制。

从实现上的优点：

HBase采用强一致性模型，在一个写返回后，保证所有的读都读到相同的数据。
通过HRegion动态Split和Merge实现自动扩展，并使用HDFS提供的多个数据备份功能，实现高可用性。
采用HRegionServer和DataNode运行在相同的服务器上实现数据的本地化，提升读写性能，并减少网络压力。
内建HRegionServer的宕机自动恢复。采用WAL来Replay还未持久化到HDFS的数据。
可以无缝的和Hadoop/MapReduce集成。

实现上的缺点：

WAL的Replay过程可能会很慢。
灾难恢复比较复杂，也会比较慢。
Major Compaction会引起IO Storm。
。。。。

参考：

https://www.mapr.com/blog/in-depth-look-hbase-architecture#.VdNSN6Yp3qx
http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable
http://hbase.apache.org/book.html
http://www.searchtb.com/2011/01/understanding-hbase.html
http://research.google.com/archive/bigtable-osdi06.pdf

时间： 2024-08-30 11:32:34

深入HBase架构解析（二）的相关文章

深入HBase架构解析（一）

前记公司内部使用的是MapR版本的Hadoop生态系统,因而从MapR的官网看到了这篇文文章:An In-Depth Look at the HBase Architecture,原本想翻译全文,然而如果翻译就需要各种咬文嚼字,太麻烦,因而本文大部分使用了自己的语言,并且加入了其他资源的参考理解以及本人自己读源码时对其的理解,属于半翻译.半原创吧. HBase架构组成 HBase采用Master/Slave架构搭建集群,它隶属于Hadoop生态系统,由一下类型节点组成:HMaster节点.HR

HBase架构解析

Hbase组件客户端Client 整个HBase集群的入口使用HBase RPC机制与HMaster和HRegionserver通信与HMaster通信进行管理类的操作与HRegionserver通信进行读写类操作包含访问HBase的接口,并维护cache来加快对HBase的访问,与HRegionserver交互程序协调服务Zookeeper 保证任何时候,集群中只有一个Master 存贮所有Region的寻址入口实时监控Region server的上线和下线信息.并实时通知给

万达网络科技的DevOps平台架构解析

转载本文需注明出处:微信公众号EAWorld,违者必究. 目录: 一.万达DevOps平台建设历程二.平台架构解析三.建设过程中的难点分享四.总结一.万达DevOps平台建设历程本文讲的是万达网络科技的DevOps平台架构解析,我们从2017年2月份开始帮助万达网络科技建设DevOps平台,2017年6月份完成试运行上线交付.目前万达网络科技公共平台研发中心的所有产品和项目都已经通过DevOps平台管理起来,实现了全面的持续集成.持续交付等能力,并持续进行过程度量和改进,不断提升IT运

游戏云间之游戏架构解析

游戏架构解析--游戏云间系列五说起架构,分为两块,一个是软件层次的代码架构,另外一个是硬件层次的系统架构.软件层次的,模块划分.代码重构及业务层的架构为主.系统层次的,以网络.部署.服务器集群为主.软件层次的架构,在于前期代码研发.硬件层次的系统架构,在于后期的服务器部署上线.今天的内容主要偏向于游戏领域的系统架构. 谈起系统架构,无外乎就那些技术,什么负载均衡啊,什么数据库垂直.水平分区啊.前端/后端缓存.nosql什么什么的.几乎任何行业里面的架构,都离不开这些技术.今天要说的是游戏架构,

使用zxing工具包创建和解析二维码

关于二维码是什么,以及二维码是如何生成的,我也没有研究得很深入,就不多说了,以免误导大家.请参看: java 二维码原理以及用java实现的二维码的生成.解码二维码的生成细节和原理下面是一个可以生成和解析二维码的工具类,该类用到了zxing工具包,我通过Maven去下载的: ? 1 2 3 4 5 6 7 8 9 10 11 12 13 <dependencies> <!-- JavaSE包依赖于Core包,因此Core包不需要直接依赖了 <dependency

笙淋：百度粉丝网网站架构解析

笙淋:百度粉丝网[新]网站架构解析,希望大家能提出宝贵意见. 记得网络中曾经出现过百度爱好者和百度粉丝网等相关类型的网站,而今天大家看过这个话题,可能对于本站很有疑问,现在做这样的网站是不是有点过时了呢?是不是有类同之前的网站之举?对于我个人感觉,这不叫类同,应该说是更进一步的拓展,看了之前的此类型的网站,都是以宣传百度信息为主,的确成为了百度的非常忠实信息传播窗口.但,对百度粉丝的展示却是特别的少,而本站百度粉丝网[新],与其它几个这样的网站,唯一的不同就是更多的为我们百度忠实的粉丝着想.一是

asp.net C#生成和解析二维码代码

类库文件我们在文件最后面下载 [ThoughtWorks.QRCode.dll 就是类库] 使用时需要增加: using ThoughtWorks.QRCode.Codec; using ThoughtWorks.QRCode.Codec.Data; using ThoughtWorks.QRCode.Codec.Util; 主要源代码: 1.生成二维码代码如下 QRCodeEncoder qrCodeEncoder = new QRCodeEncoder(); String enco

《Android应用开发从入门到精通》——第1章，第1.2节Android架构解析

1.2 Android架构解析 Android应用开发从入门到精通 Android系统的底层建立在Linux系统之上,该平台采用一种称为软件叠层(Software Stack)的方式进行构建.这种软件叠层结构使得层与层之间相互分离,明确各层的分工.这种分工是软件工程中常说的低耦合高内聚的设计概念. 1.2.1 Android系统架构图 Android作为一个移动设备的平台,其软件层次结构包括了内核层.中间件和应用程序.下面看看Android的系统架构图,如图1.2所示. 如图1.2所示,Andr

google zxing 生成和解析二维码

maven 项目pom.xml文件配置 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd&qu

猜你喜欢

ajax中传递中文参数的编码问题

ajax|编码|问题|中文遇到问题:在使用xhr发出请求时,请求的url中参数带中文,这时在后台解析request得不到中文如:request = new ActiveXObject("M ...

软件也兼职 Word2003的另类玩法

大家都知道Word是文字处理软件中佼佼者,不过你知道吗?它还可以播放网络电影.Flash,还具有英汉双向翻译,给词语加注解等有趣功能,本文就专门把Word2003(以下简称Word)中的这些" ...

PS制作雷达扫描动画

效果图: 新建个250*200的画布.填充灰色做背景--用椭圆工具画个#bacce5的正圆. 图层样式现在看起来像个椭圆的饼饼. 咬下去吧!画个颜色是#00387d的蓝色圆圆,要比刚刚的那个饼小 ...

百度卫士3.0全新设计使用起来更简单

一.全新设计,使用起来更简单二.新增视频加速功能,免费提升家庭带宽速度,最高可达10倍三.主动防御让安防全面升级四.可以使用百度账号登录百度卫士,登录越久等级越高五.运行加速功能重新设计 ...

酷狗音乐2015的丽音是什么

丽音其实就是音效增强技术,但不是音质还原技术.音质还原是每个歌曲必须的.因为歌曲经过格式转换后会损失音质,比如普通mp3格式对音质损失就比较厉害,这时就可以通过音质还原技术使音质最大程度还原到和原 ...

怎么关闭360双ctrl搜索

方法1 1按两下Crtl 调出360搜索,再点击搜索栏边上的小齿轮如图所示: 2再把[开启快捷搜索,双击Ctrl键想搜就搜]前面的勾取消掉. 3在定要关闭快捷搜索. END 方法2 打开360的主 ...

U盘装系统出现白屏故障怎么办？

最近,小编发现了一个现象,很多朋友在重装系统或者是安装系统的时候,都会倾向于使用U盘装系统,不管这是一种趋势也好,是一种习惯也好,咱们不得不说,U盘装系统已经成为大众比较青睐的一种方式了.不过,这 ...

详解jQuery插件开发中的extend方法_jquery

Jquery的扩展方法extend是我们在写插件的过程中常用的方法,该方法有一些重载原型,dest是要整合的空间可以使{} 或者不写 src是一个JSON表达式表示的javascript对象.... ...

matlab-vs 2010 跟MATLAB混合编程老报错

问题描述 vs 2010 跟MATLAB混合编程老报错执行到MATLAB函数时软件会报错:Precision Design.exe 中的 0x758f812f 处有未经处理的异常: Microsof ...

“大数据”如何强化乃至取代管理?

美国一家颇具规模的零售企业的营销高管最近发现自己看不懂销售报告了.它的一家主要竞争对手正在一系列业务领域持续扩大市场份额.尽管打出了在线促销和优化销售的组合拳进行反击,但她的公司还是不断丢城失地. 于 ...

Android中如何读写Word doc/ docx和PDF文件？

最近在项目中要生成Word的doc和docx文件,一番百度google之后,发现通过java语言实现的主流是Apache的POI组件.除了POI,这里还有另一种实现 ,不过我没有去研究,有兴趣的同学 ...

一个程序，多级指针跨函数使用问题。

问题描述一个程序,多级指针跨函数使用问题. 我想通过多级指针改变某个参数的值,代码如下: include void f(int ** q) { int ai = 100; *q = &i; ...

360告赢傅盛：傅盛微博言论被判对360造成侵权

战罢腾讯,奇虎360和其他宿敌们的诉讼大战仍在继续.昨天,法院对奇虎360诉傅盛名誉权纠纷一案作出一审判决,判定金山网络CEO傅盛的微博言论对奇虎360造成侵权,要求其赔偿并道歉. 法院判决书显示,该 ...

android-手机录音raw转成mp3遇到了问题

问题描述手机录音raw转成mp3遇到了问题我在网上找到的关于lame将android的arm格式音频转化为通用的mp3, 目前在5.0以下的版本运行没有问题,在5.0的android手机运行出现 ...

ios-coredata问题求指教。。。

问题描述 coredata问题求指教... 一运行就报错,跪求大神指点下面是控制台显示: 2015-09-05 06:40:03.802 Scd[687:12249] *** Terminating ...

win7下载gz文件，解压时弹出文件损坏，重新下载了好几次都是这个情况，求大神啊

问题描述 win7下载gz文件,解压时弹出文件损坏,重新下载了好几次都是这个情况,求大神啊 win7下载gz文件,解压时弹出文件损坏,重新下载了好几次都是这个情况,求大神啊解决方案要么就是本身文件 ...

绝对不止两三招电子商城吸引客户手段分析

中介交易 SEO诊断淘宝客云主机技术大厅第1页前言以及熬吧马同学的悲剧前言:俗话说,铁打的店铺流水的顾客,自从有了商铺这种概念开始,商人们为了两件事情在忙:吸引新客人和留住旧客人,让利酬宾 ...

中国概念股危机并未离去

上周,新浪股价收复100美元,与此同时百度以及众多在美国上市的中国概念股也迎来了反弹.中国概念股的危机真的就此过去了吗? 至少,已经上市或者正在上市路上的公司忍不住开始摇旗呐喊了.百度CFO李昕晢觉 ...

三星数码摄像机HMX-F80如何查看光盘中的中文说明书

步骤 1. 放入光盘将随机的说明书光盘放入电脑的光驱. 注:此光盘为电脑的安装光盘,只能在电脑的光驱中读取,切勿放入DVD等设备. 步骤 2. 查找说明书 1.电脑自动读取光盘,在弹出的 ...

select-C# LINQ 数据绑定及查询

问题描述 C# LINQ 数据绑定及查询刚开始,不懂绑定语法是哪个,怎样限制多条件,多表联合查询某个数据. public decimal ZhiXingShuLiang(Guid HeTongHa ...

seo-关于搜索引擎收录网站问题。

问题描述关于搜索引擎收录网站问题. 用Eclipse写好了一个网站项目后,本地测试过没问题了(包括增删改查,跟新发布内容)后 ,怎样把它放到网上的? 解决方案网站搜索引擎优化问题网站搜索引擎优化问 ...

社区和社交产品的本质与区别

不少人容易把社区产品和社交产品混淆,其实两者有着巨大差别.本文简单谈谈. 社区产品,结构上类似于人类社会发展中的部落形态.一群人依照某种主题.兴趣或某种其他原因组成.大家围绕着这个核心,聚集成了一个相 ...

datastage安装过程中出现问题

问题描述 datastage安装过程中出现问题ProductException:(errorcode=601;message="ERepositoryInstaller65517:Anerr ...

请帮我实现这2个方法，谢谢。

问题描述请帮我实现这2个方法,谢谢.要求代码越少越好,可以另外再添加类或方法 /** *根据id将Ms们进行排序(id由大到小) */ public List orderbyid(List list ...

Session函数库：session_decode

session_decode (PHP4) session_decode ---&http://www.aliyun.com/zixun/aggregation/37954.html" ...

ognl-求解struts2 中 OgnlValueStack 类的字段 overrides; 是干吗用的？

问题描述求解struts2 中 OgnlValueStack 类的字段 overrides; 是干吗用的? 求解struts2 中 OgnlValueStack 类的字段 Map overrides ...

VBScript的入门学习资料_vbs

Microsoft Visual Basic Scripting Edition 是程序开发语言 Visual Basic 家族的最新成员,它将灵活的 Script 应用于更广泛的领域,包括 Micr ...

《HTML5 canvas开发详解（第2版）》——2.6　在画布上合成

2.6 在画布上合成合成是指如何精细控制画布上对象的透明度和分层效果.有两个属性可以控制Canvas合成操作:globalAlpha和globalCompositeOperation. global ...

有会用vb.net和SQL交互做软件的，联系我！$$$

问题描述联系方式:qq434684189 解决方案解决方案二:求教高手!!酬谢解决方案三:这里的人都会用vb.net和SQL交互做软件解决方案四:交互做软件什么意思,连SQL数据库?解决方案五:不 ...

linux c模拟ls命令详解_C 语言

复制代码代码如下: /* 模拟ls命令,实现参数-tariRl.有些代码重复出现,可改进可以在该程序的基础上增加参数,该程序思路清晰,容易扩展 */#include<stdio.h># ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.029 s.