HDFS中数据节点数据块存储示例

数据块在数据节点上是按照如下方式存储的。

首先是一个存储的根目录/hadoop/data/dfs/dn，如下图所示：

接着进入current目录，如下图所示：

再进入后续的BP-433072574-192.168.1.224-1440568979639下current目录，如下图所示：

在它下面，有一个版本号文件VERSION和分布式文件系统使用情况文件dfsUsed，然后就是两个文件夹，其中rbw存储的是处于写过程中的数据块，而finalized存储的则是写已完成并提交的数据块。我们看下finalized下的内容，如下图所示：

finalized下有很多子目录，进入subdir4，如下图所示：

又有很多子目录，再进入subdir42，如下图所示：

这就是数据块数据文件及其元文件的真正存储地了，其中blk开头的数据块数据文件，数字表示数据块ID，而.mta结尾的则是数据块元数据问文件。数据块副本的存储路径有一个基础路径，并由众多的子路径保持组成。这几点与我们在《HDFS源码分析之数据块Block、副本Replica》一文中讲到的一样。

时间： 2024-10-25 15:15:06

HDFS中数据节点数据块存储示例的相关文章

hadoop单个数据节点的不同存储路径的存储策略源码分析。

产生问题于数据集群的数节点存储磁盘大小不同,造成使用一段时间以后容量小的磁盘空间紧张. 其实,早期配置了磁盘使用存储策略,就能解决该问题,部分网来上说这个策略无效,再hadoop2.0.1 本版有效,该版本应用于CHD4.6中. 为了找到准确的程序定位点,参考了以下的Hadoop设计文档. 参考 Hadoop中HDFS文件系统的Append/Hflush/Read设计文档: http://blog.csdn.net/chenpingbupt/article/details/7972589 文档中

winform 项目获取app.config 中appSettings节点数据

<?xml version="1.0" encoding="utf-8" ?> <configuration> <configSections> <sectionGroup name="applicationSettings" type="System.Configuration.ApplicationSettingsGroup, System, Version=4.0.0.0, Culture

简述Hadoop HDFS中的数据块和Map任务的分片

HDFS的数据块磁盘数据块是磁盘进行数据读/写的最小单位,一般是512字节, 而HDFS中也有数据块,默认为64MB.所以HDFS上的大文件被分为许多个chunk.而HDFS上的小文件(小于64MB)的文件不会占据整个块的空间. HDFS数据块设置大的原因是减少寻址开销,数据备份也是以块为单位的. 用hadoop fsck / -files -blocks 命令可以检查HDFS根目录(/)下所有文件,块的健康状况: Map任务的分片: 为什么推荐Map任务的分片尺寸和HDFS基本块的大小一致为

HDFS源码分析数据块校验之DataBlockScanner

DataBlockScanner是运行在数据节点DataNode上的一个后台线程.它为所有的块池管理块扫描.针对每个块池,一个BlockPoolSliceScanner对象将会被创建,其运行在一个单独的线程中,为该块池扫描.校验数据块.当一个BPOfferService服务变成活跃或死亡状态,该类中的blockPoolScannerMap将会更新. 我们先看下DataBlockScanner的成员变量,如下: // 所属数据节点DataNode实例 private

数据同步-mysql集群扩展一个数据节点问题

问题描述 mysql集群扩展一个数据节点问题现在搭建成功集群是一个管理节点,2个数据节点和2个sql节点,在这基础上增加一个数据节点,即 3个数据节点 ,实现3个数据节点数据同步,我是修改了config.ini配置文件里的NoOfReplicas = 2改为了NoOfReplicas = 3 ,并加了一个数据节点配置信息在配置文件中,重新启动集群显示数据节点没有全部连接上,应该是NoOfReplicas = 3这个有问题,或config.ini还有什么需要修改的地方,请大神指教,在此十分感谢

HDFS源码分析数据块复制选取复制源节点

数据块的复制当然需要一个源数据节点,从其上拷贝数据块至目标数据节点.那么数据块复制是如何选取复制源节点的呢?本文我们将针对这一问题进行研究. 在BlockManager中,chooseSourceDatanode()方法就是用来选取数据块复制时的源节点的,它负责解析数据块所属数据节点列表,并选择一个,用它作为数据块的复制源.其核心逻辑如下: 我们优先选择正处于退役过程中的数据节点而不是其他节点,因为前者没有写数据传输量因此相对不是很繁忙.我们不使用

HDFS源码分析数据块汇报之损坏数据块检测checkReplicaCorrupt()

无论是第一次,还是之后的每次数据块汇报,名字名字节点都会对汇报上来的数据块进行检测,看看其是否为损坏的数据块.那么,损坏数据块是如何被检测的呢?本文,我们将研究下损坏数据块检测的checkReplicaCorrupt()方法. 关于数据块及其副本的状态,请阅读<HDFS源码分析之数据块及副本状态BlockUCState.ReplicaState>一文. checkReplicaCorrupt()方法专门用于损坏数据块检测,代码如下: /** *

HDFS源码分析数据块复制监控线程ReplicationMonitor（一）

ReplicationMonitor是HDFS中关于数据块复制的监控线程,它的主要作用就是计算DataNode工作,并将复制请求超时的块重新加入到待调度队列.其定义及作为线程核心的run()方法如下: /** * Periodically calls computeReplicationWork(). * 周期性调用computeReplicationWork()方法 */ private class ReplicationMonitor implements Runnable

Hadoop环境中管理大数据存储八大技巧

在现如今,随着IT互联网信息技术的飞速发展和进步.目前大数据行业也越来越火爆,从而导致国内大数据人才也极度缺乏,大讲台了解这一情况后专门在网上开通了这一门大数据培训课程,下面来介绍一下关于Hadoop环境中管理大数据存储技巧吧. 1.分布式存储传统化集中式存储存在已有一段时间.但大数据并非真的适合集中式存储架构.Hadoop设计用于将计算更接近数据节点,同时采用了HDFS文件系统的大规模横向扩展功能. 虽然,通常解决Hadoop管理自身数据低效性的方案是将Hadoop数据存储在SAN上.但这也

猜你喜欢

PHP 高手之路（三）

使用str-replace而不是ereg-replace 习惯使用Perl进行编程的程序员更加愿意使用ereg_replace完成字符串替换工作,因为在PHP中ereg_replace的用法和Perl ...

使用跟踪事件10046

很多时候,对数据库进行性能诊断可以使用SQL跟踪的方法,把一些信息记录在trace文件里以后分析.一般情况下我们可以通过初始化参数SQL_TRACE=TRUE来设置SQL跟踪. 我们也可以通过 ...

使用Statspack的几个误区

使用Statspack的几个误区作者: Fenng Statspack 是 Oracle 提供的一个实例级的Tuning工具.很多DBA都喜欢用这个工具来进行数据库的优化调整.不过在交流中发现很多朋 ...

设计参考:基于CSS网格框架的网站设计实例

基于CSS网格框架的网站设计已经越来越广泛,无数的开源CSS网格框架平台也因此而簇生,在这些开源CSS框架的基础上进行Web开发,提高效率的同时,还能更好地保证页面的规范和标准,给无数的Web开发人员 ...

线收邮件

一个可以在线收邮件的东东不能收MINE的信件.可以考虑使用BASE64解码什么东东来实现.具体我忘了. 刚刚写出来的.还不是很成熟. //input.html ///////////////// ...

如何给自己的产品增值 SEO不仅仅是优化

做seo也有一段时间了,从小的seo团队开始算摸石头过河一路摸爬滚打,到现在带着那么多人做seo,一直在研究的道路奋进,从来没有松懈过.这一路走来随着见的人的增多包括自己眼界的开阔,视野也慢慢的变的宽 ...

Sql与Asp.Net数据类型对应(引用MsDN)

asp.net|数据|数据类型 BigInt 受 .NET Framework 精简版的支持. Int64 一个 64 位的有符号整数. Binary 受 .NET Framework 精简版的支持. ...

SQL Server中的Processor Affinity

SQL Server通常都运行在多处理器的服务器上,这一点在现在尤为普遍.原因是多内核的处理器越来越普及. 那么,在多处理器环境下,Windows操作系统(事实上是从2000开始的)通常都会将进程任务 ...

Head First C#中文版（page6）

下面这些是你需要创建的你需要一个有GUI的应用程序.一个可以和数据库说的上话的对象.数据库本身.还有一个安装包.听起来工作量很大,但是读完下面这几页你就可以创建完这些. 下面是我们要创建的程序的结构 ...

php结合ACCESS的跨库查询功能

问题说明: 有时需要在两个或三个数据库的表中,通过相关关键字,查询获取所需记录集,用一般的SQL查询语句是实现不了的,可通过ACCESS的跨库查询功能实现. 解决方法: 例如"装材类型&q ...

Dreamweaver网页制作之菜单概述

菜单概述本节提供 Dreamweaver MX 2004中各菜单的简要说明.下图为菜单条: 以下分别叙述菜单选项: 文件菜单编辑菜单 "文件"菜单包含"新建" ...

PS让你的照片更有代入感

在对照片进行处理时,很少能绕开对色彩以及色调的优化或者修改.如果说这种处理为照片处理者提供了巨大的创作空间,那么我们也可以说它是几乎所有的照片处理都要求有的最基本的步骤. 一组优秀的作品一定需要在 ...

Photoshop绘制蒸汽朋克女火枪手

这次教程带来一幅女火枪手的海报绘制教程.海报是描绘蒸汽时代阶级斗争背景下,一位保卫宫廷财富的高傲贵族女火枪手.创作时,我让画面尽可能充满光辉与华丽,设计中融入了洛可可服饰与蒸汽朋克武器的特色元素,让冰 ...

在Word2007中设置艺术字阴影效果和颜色

在Word2007文档中,用户可以为艺术字设置包括投影.透视在内的多种阴影效果,具体操作步骤如下所述: 工具/原料 Word2007 步骤/方法第1步,打开Word2007文档窗口,单击选中艺术字. ...

Windows8的大改变

"Reimagine"一词用来形容Windows 8非常合适,用这个词来形容新的Windows 8意指拥新的Windows 8拥有新的外观,新加入的对ARM架构的支持,新的启动屏幕 ...

一体机系统下主机内置麦克无声解决

一体机的内置麦克风一般集成到摄像头,即摄像头上集成声卡芯片,WIN7系统下内置麦克风和外接麦克可以互换,若该系统下内置麦克风无声一般是摄像头驱动未正常安装或录音设备中禁用了摄像头上的录音设备,但在XP ...

Win2003 设置远程连接限制数

在开发过程中,很多同事需要连接到一台Win2003服务器,但是连接人数超过了10个,就连接不上了.想设置一下连接限制数,可以如下操作: 1:在运行里面输入gpedit.msc后,弹出"本 ...

阿里云闵万里：用多体多能的智能普惠每个人是阿里云的终极目标

10月12日,阿里云机器智能首席科学家闵万里在2017杭州·云栖大会上表示,人工智能以往是单点呈现,未来要做的是串联单点技术,不断进化成多体多能. 闵万里以工业生产为例,假定一条流水线有ABCDEFG ...

CSS之可折叠导航

简述下面我们来讲述如何仅仅用CSS来实现一个可折叠的导航. 简述 nav标签 summary标签效果源码解释为小三角添加CSS样式 <nav>标签定义和用法 <nav&g ...

关于Debug和Release之本质区别

------------------------------------- 本文主要包含如下内容: 1. Debug 和 Release 编译方式的本质区别 2. 哪些情况下 Release 版会出错 ...

Weex&ReactNative对比

weex开源有一段时间了,其实去年刚听说weex这个项目的时候,我就对它很敢兴趣,很大程度上是因为我自己对vue的喜爱.我从13年左右开始接触vue,14年开始熟悉这个轻量的框架,并慢慢的推荐给了身边 ...

xutils 聚合函数-Android开元框架虚体绿色的Dbutils操作

问题描述 Android开元框架虚体绿色的Dbutils操作谁用过xutils框架啊?那个Dbutils如何使用聚合函数啊?我现在主要获取数据库聚合函数sun如何查询啊?还有Dbutils需要手动关 ...

图片-java面板设置问题，新手求解

问题描述 java面板设置问题,新手求解如何设置点击这个按钮能呈现出图中的效果? 解决方案 Java新手问题汇总解决方案二: 可以用java swing的消息弹出框. JOptionPane.sh ...

手机建站jquery mobile

问题描述手机建站jquery mobile 共用新闻列表页面,jquery 动态添加内容,可点击导航后,jquery选择的还是第一次选择的页面,怎么解决,请赐教

聊天室在线人数怎么获取

问题描述聊天室在线人数怎么获取解决方案获取不到,现在没有提供接口

影视剧该如何做好宣传?

十一月的影坛略显沉寂,没有华丽的好莱坞大片,也缺少大手笔的制作,宣传上也少了很多声势,街头巷尾的海报宣传少了,电视上的娱乐报道也少了.如此情况下,影视剧该如何做好宣传?以更低成本获得更好的营销效果呢? ...

微软中国济南分公司下月运营

济南市商务局总经济师梁旭斌告诉http://www.aliyun.com/zixun/aggregation/79250.html">本报记者,按照上月济南市政府与微软中国签订的战略合 ...

有关Session的GridView奇怪的数据绑定问题！

问题描述有两个页面,分别为A.aspx和B.aspx在A页面中添加一个Dropdownlist1和Button1控件,通过点击Button1,将Dropdownlist1选择后的值赋给一个Sessi ...

【50分】这个API怎么调用？

问题描述函数原型:LPWSTR*CommandLineToArgvW(LPCWSTRlpCmdLine,int*pNumArgs);用于将一个表示命令行的字符串分解为各个参数[DllImport(& ...

创造2.32亿美元ICO奇迹后，Tezos宣布成立5000万美元风控

2017年是数字货币最热闹的一年.冒险者们不断探索新的投资方式,而ICO就是其中最具争议性的话题.据Smith+Crown的数据显示,2017年全球通过ICO募资的规模超过5.6亿美元,远高于通过VC ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.032 s.