Hive动态分区导致的Jobtracker Hang问题

　　熟悉Jobtracker的都知道，在进行Job初始化时Eager">TaskInitializationListener会锁住 JobInProgress然后进行InitTask,细节请各位查看代码，这里有一步就是需要向hdfs写入初始数据并flush，而 Fairscheduler的Update Thread在更新资源池的资源时是在持有JobTracker和Fairscheduler的独占锁然后再去计算每个资源池的资源情况，而计算 running_map/running_reduce的时候要去获取相应的JobInProgress锁，各位读者可能不明白，我为啥要讲这块呢，问题就出现在这里.

　　Hive在处理动态分区的时候，主要经历这么几个步骤tablescan->filesink->movetask

　　在进行filesink的时候是根据记录来处理的，会起N(part)个record writer然后开始处理动态分区字段，即这里的dt，如果dt是连续的那么打开一个block开始写，否则关闭当前block，打开新dir的 block继续写，这里如果dt是不连续的出现并且记录数量巨大的情况下会产生大量的文件，导致hdfs的负载标高，和当时的hdfs的监控是匹配的：

　　当时的集群负载：

　　当时产生的文件数：

　　进而导致JobInProgress被锁住，从而JobTracker被锁住，导致JobTracker Hang住了!

　　那怎么解决呢?利用distributeby dt把相同的dt排列到一起再进行filesink就不会造成大量的小文件产生了。

时间： 2024-09-20 01:08:59

Hive动态分区导致的Jobtracker Hang问题的相关文章

mysql主键的缺少导致备库hang

最近线上频繁的出现slave延时的情况,经排查发现为用户在删除数据的时候,由于表主键的主键的缺少,同时删除条件没有索引,或或者删除的条件过滤性极差,导致slave出现hang住,严重的影响了生产环境的稳定性,也希望通过这篇博客,来加深主键在innodb引擎中的重要性,希望用户在使用RDS,设计自己的表的时候,一定要为表加上主键,主键可以认为是innodb存储引擎的生命,下面我们就来分析一下这个案例(本案例的生产环境的binlog为row模式,对于myisam存储引擎也有同样的问题): (1).现

动态分区AOMEI Dynamic Disk Manager Pro Edition

问题描述动态分区AOMEI Dynamic Disk Manager Pro Edition 如何使用AOMEI Dynamic Disk Manager Pro Edition动态分区.全英文的,不敢下手,怕把资料都丢了.最好说清楚每个步骤,有图最好解决方案动态分区为什么非要用这个,用Paragon Partition Manager,这个有中文的,都用了多少年了,没出过问题 http://www.jz5u.com/soft/system/disk/14559.html 解决方案二: p

mysql主键的缺少导致备库hang住_Mysql

最近线上频繁的出现slave延时的情况,经排查发现为用户在删除数据的时候,由于表主键的主键的缺少,同时删除条件没有索引,或或者删除的条件过滤性极差,导致slave出现hang住,严重的影响了生产环境的稳定性,也希望通过这篇博客,来加深主键在innodb引擎中的重要性,希望用户在使用RDS,设计自己的表的时候,一定要为表加上主键,主键可以认为是innodb存储引擎的生命,下面我们就来分析一下这个案例(本案例的生产环境的binlog为row模式,对于myisam存储引擎也有同样的问题):(1).现象

阿里云大数据利器之-RDS迁移到Maxcompute实现动态分区

当前,很多用户的业务数据存放在传统关系型数据库上,例如阿里云的RDS,做业务读写操作.当数据量非常大的时候,此时传统关系型数据库会显得有些吃力,那么会经常有将mysql数据库的数据迁移到[大数据处理平台-大数据计算服务(Maxcompute,原ODPS)(https://www.aliyun.com/product/odps?spm=5176.doc27800.765261.309.dcjpg2),利用其强大的存储和计算能力进行各种查询计算,结果再回流到RDS. 一般情况下,业

大数据-Hive 空间沾满导致的问题

问题描述 Hive 空间沾满导致的问题在将mysql中的数据使用sqoop倒入到Hive中时,突然出现报了一个这样的错误 Exception in thread "main" java.lang.RuntimeException: Could not create temporary directory: /tmp/sqoop-hadoop/compile/db49351e236be8b1f51ee53f4a743551; check for a directory permissi

关于闪回区溢出导致的数据hang（r11笔记第12天）

对于Oracle数据库的闪回区的设置,之前和一个同事和讨论过,总体来说有一些不同的意见. 首先这个闪回区是一个逻辑的概念,闪回区的大小不会严格依赖于磁盘空间的情况,比如磁盘空间目前剩余100G,但是你设置闪回区为200G是没有问题的. 如此一来,和只使用归档参数想比,这个闪回区似乎有一点问题,总体来说闪回区的管理还是比较方便的,可以监控管理闪回区中的归档,闪回日志,备份等的大小. 使用的视图为v$flash_recovery_area_usage,在11g做了简化,为v$recovery_are

移动硬盘分区方法分享，分区导致数据丢失该如何恢复？

随着数据时代的爆发,我们需要存储的数据与日俱增,所以移动存储产品便成为我们生活中必不可少的部分.然而,现在我们买回来的移动硬盘基本就只有一个分区,对于我们存储分门别类的文件带来很大不便,所以我们需要对其进行分区操作,以方便我们更加有条理的管理硬盘中的文件.移动硬盘分区的时候如果硬盘中保存了重要的文件,需要将其备份,因为分区的时候会导致数据丢失.不过很多用户都会忘记对移动硬盘进行备份,或者闲麻烦不想备份,这就导致移动硬盘分区后发生数据丢失的情况,要怎么才可以解决数据丢失的问题呢? 下面我先向大家介

密码延迟验证导致的系统HANG住

又是一个11g新特性导致的问题. [@more@] 这个新特性很早之前就研究过,也在其他客户处碰到过类似的问题.从11g开始,如果一个用户使用不正确的密码尝试登录数据库,那么随着登录失败次数的增加,每次登录验证前延迟等待的时间也会增加: SQL> set time on 18:30:54 SQL> 18:30:58 SQL> conn test/test Connected. 18:31:25 SQL> 18:31:25 SQL> conn test/a conn test/

MySQL内核月报 2014.11-MySQL·　捉虫动态·SIGHUP 导致 binlog 写错

bug描述这是5.6中和gtid相关的一个bug,当 mysqld 收到 sighup 信号 (比如 kill -1) 的时候,会 flush binlog,但是新生成binlog开头没写 Previous_gtids_log_event,这会导致下面 2 个问题: 这个时候 mysqld 重启的话,会发现再也起不来了,error log 里有这样的错 The binary log file 'mysql/mysql-bin.000020' is logically corrupted: Th

猜你喜欢

编程心得:提升JSP应用程序的7大绝招

js|编程|程序|心得你时常被客户抱怨JSP页面响应速度很慢吗?你想过当客户访问次数剧增时,你的WEB应用能承受日益增加的访问量吗?本文讲述了调整JSP和servlet的一些非常实用的方法, ...

HTML网页通过XHTML验证需要注意的6点

xhtml|网页符合标准的网页是要通过XHTML验证的在我们制作网页时需要注意以下6点内容. 1.必须在文档开始声明文档的类型. 建立XHTML文档首先我们最重要的就是要生命该文档是什么类型的有很多 ...

Web接口远程维护Windows2003服务器

微软的网络操作系统Windows server 2003(简称Windows 2003)新增了很多有价值的功能,如远程维护Web接口.利用该功能,网络管理员可以通过Web浏览器远程维护整个Window ...

Windows Vista下安装Apache2+PHP5+MySQL5+phpMyAdmin

为了以后重装系统方便,建议不要安装在系统盘,这里安装在D盘.可以是根目录,亦可以是其它目录,但最好目录名中不要有空格,这样可以避免某些错误的出现. 安装Apache 2.2.4 开始后,同意协议,一路 ...

算法系列（二）三只水桶等分水问题

有一个容积为8升的水桶里装满了水,另外还有一个容积为3升的空桶和一个容积为5升的空桶,如何利用这两个空桶等分8升水?附加条件是三个水桶都没有体积刻度,也不能使用其它辅助容器. 这是一道经典题目,一般 ...

PPT的排版技巧

PPT的排版技巧 PowerPoint 这款软件自带了一些主题模板,但坦白讲,我认为不是十分的美观: 我教大家三个方法,来做出实用性强且操作简单的PPT版式结构,插入形状即可 ...

cpu风扇选购指南

要真正实现散热风扇的低噪音,风扇轴承的选择很重要,不同类型的风扇轴承,其噪音控制的差别非常大.如何选购cpu风扇?其实,我们购买散热风扇时,一般都可以从它的标签英文字母中获得相关的轴承信息,读懂这些信 ...

Jquery实现网页跳转或用命令打开指定网页的解决方法

本篇文章是对使用Jquery实现网页跳转或用命令打开指定网页的解决方法进行了详细的分析介绍,需要的朋友可以参考下 Jquery实现网页跳转或用命令打开指定网页!location.href = &q ...

PowerPoint2010中如何调出/使用/复制和删除参考线

视图--网格和参考线,在出现的那个界面除了第一个打钩的不删除其他的都去掉选择. 具体步骤: ①启动PowerPoint2010,我们先调出参考线,单击菜单栏--"开始"--&q ...

让图示穿上颜色说说话

最常见的一个例子就是男女生厕所的区别标志,从最常见的人形符号.性别符号以外,我们也常在许多场合看到各种创意的性别区别符号,像是电影「赌侠」中在赌神号中的厕所门口即是用PUKE牌的 King 以及 ...

PS制作拼图效果的动态签

效果图 1.新建500*200,拖入一张图移动到合适位置 2.利用视图--标尺;视图--新建参考线将图均分为10份 3.将每份分别剪切后原位粘贴,成为10个图层(我用的是本办法,一个一个选区后剪 ...

U盘能一直插着吗

有些用户为图方便,把买来的U盘一直插在电脑上,轻易不取下,但熟不知这样做害处多多. 在电脑启动时,操作系统每次都检测USB,有时冲击电流很大,久而久之很容易导致U盘芯片及USB接口的损坏,尤其是碰 ...

android-从 edittext 中获取内容

问题描述从 edittext 中获取内容在我的程序中,一个tableLayout里有很多的editTexts.当我点击保存按钮,我想访问editTexts中所有输入的值.当创建表格的时候,在运行时 ...

js-文本框限制用户只能输入0---1.5之间的数字且最多允许两位小数

问题描述文本框限制用户只能输入0---1.5之间的数字且最多允许两位小数不知道什么原因,昨下午的提问竟然没有了,现在再重新请教各位前辈,有一个需求是希望用户只能在文本框中输入0至1.5之间的数字, ...

移动浏览器份额：Safari 居首 Chrome 仅1.1%

11月,全球移动浏览器份额.Safari领跑,Chrome仅占1%. 北京时间12月3日晚间消息,调研公司Net Applications最新数据显示,今年11月,苹果Safari仍领跑全球移动浏览器 ...

c++-C++怎么读取指定目录下的wmf格式图片？

问题描述 C++怎么读取指定目录下的wmf格式图片? 环境为VS2010,需要将图片显示出来,菜鸟求救,最好有代码,谢谢

通向架构师的道路（第十九天）使用maven构建Spring工程

一.前言上次大家拿了我上传的工程后,有些人自己通过spring3,struts1.3,hibernate3的download的包自行去装配jar包到工程的WEB-INF\lib目录下.有些是通过我上 ...

华硕“芯片门”本周四再开庭

装甲防弹车押运关键证据 □ 何军备受关注的黄静诉华硕电脑公司消费欺诈并索赔500万元一案,经过两轮证据交换后,由于黄静代理人质疑华硕公司向法庭提交的多份证据存在事后伪造情形,法院决定于6月11日上 ...

c++-解高次方程，除二分法

问题描述解高次方程,除二分法求解一个高次方程除了二分法,还有什么好的方法.求解一个高次方程除了二分法,还有什么好的方法.求解一个高次方程除了二分法,还有什么好的方法. 解决方案 http://we ...

做好用户体验让网站成为用户喜爱的

中介交易 SEO诊断淘宝客云主机技术大厅用户体验是互联网这个大生态环境一直都在强调的事情,随着现在网络环境大净化的开始seo们越来越强调的就是回归到最为根本的事情.其实对于现在来说,用户体验是 ...

OpenWRT开发之——对C++11的支持

1. 检查gcc版本据说,gcc在4.8版本之后就支持c++11了.我们先检查一下交叉编译器的版本. $ cd SDK #进入OpenWrt的SDK路径 $ cd ./staging_dir/too ...

请问：eclipse导入源代码后出现错误，如图所示，是什么原因，怎么样解决？？

问题描述请问:eclipse导入源代码后出现错误,如图所示,是什么原因,怎么样解决?? 解决方案把鼠标放在错误位置,看下什么错.估计是有包没导进去,ctrl+shift+o 导包. 也可能是lib ...

Silverlight之out of Browser模式

摘要:在Silverlight中所有应用都可以以一种叫做OOB(Out of Browser)模式的方式脱离浏览器运行,在OOB模式下应用程序将获得更多的信任,甚至可以和windows api通信,今 ...

给我一个表结构，还你全部程序代码（页面到三层结构代码）......你相信吗?

问题描述 [autocode代码生成器]全面支持自动生成java标准代码!全面支持自动生成struts1.2标准代码!全面支持自动生成ASP.NET标准代码!全面支持当今流行的三大主流开发架构同时欢迎 ...

大数据处理公司Cloudera再融资6500万美元估值7亿美元

12月7日消息据国外科技博客AllThingsD报道,全球著名大数据处理公司Cloudera在E轮融资中再次获得6500万美元资金支持,公司估值7亿美元,公开上市的可能性开始增加.2013年,该公司 ...

4600余件域名网上拍卖无人问津

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅淄博一电子商务公司抢注200余件中 ...

MySQL中事务概念的简洁学习教程_Mysql

事务是由一步或几步数据库操作序列组成逻辑执行单元,这系列操作要么全部执行,要么全部放弃执行.程序和事务是两个不同的概念.一般而言:一段程序中可能包含多个事务. 事务具有四个特性:原子性(Atomici ...

浅析java双向冒泡排序算法_java

以整数升序排序为例来简单说明一下双向冒泡排序的过程:首先从前往后把最大数移到最后,然后反过来从后往前把最小的一个数移动到数组最前面,这一过程就是第一轮,然后重复这一过程,最终就会把整个数组从小到大排列 ...

如何选择网站关键字

1.根据网页特征选择关键词很多类型的网页都有某种相似的特征.例如,小说网页通常都有一个目录页,页面上通常有"目录"两个字,查询某篇小说时,就可在查询关键词中添加"目录& ...

unity3d-U3D如何运行下载的demo

问题描述 U3D如何运行下载的demo 如何运行从网上下载的demo. 我从网上下载了demo,文件夹里文件如下: Assets Library ProjectSettings 文件用u3d打开后感觉 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.024 s.