Hadoop平台上煤矿企业储备定额算法并行化研究与应用

Hadoop平台上煤矿企业储备定额算法并行化研究与应用

内蒙古科技大学  张翔
 
本文提出基于Hadoop云计算平台的备件消耗量预测系统。该系统分为数据获取模块、数据存储模块、数据预处理模块和备件消耗量预测模块四部分。其中,数据获取模块利用某煤炭集团公司的ERP系统Web Service接口来获取用户数据;数据存储模块中将数据获取模块中获取的备件数据按设计的数据格式存入本地Oracle数据库中;数据预处理模块利用VS2010开发程序将数据库中备件数据按要求进行处理,得到我们需要的数据格式的数据,通过多层次模糊综合评价法,从备件的关键性和备件所属设备的关键性两方面对备件重要性进行评价,量化备件重要性得到所需的裕度系数K;备件消耗量预测模块中对备件消耗量预测方法(概率统计分析法)进行改进,以经典矩阵相乘的经典算法为基础,利用MapReduce编程框架进行MapReduce化设计,构建MapReduce并行处理算法并在MapReduce并行编程模型上实现。实验结果表明,经过MapReduce设计的算法在处理器的可扩展性、数据的可扩展性和加速比性能这三方面的实验中具有良好的指标,算法性能表现良好。

Hadoop平台上煤矿企业储备定额算法并行化研究与应用

时间: 2024-07-31 21:32:23

Hadoop平台上煤矿企业储备定额算法并行化研究与应用的相关文章

小文本语料库在Hadoop平台上的存储策略研究

小文本语料库在Hadoop平台上的存储策略研究 华中师范大学 郑丽洁 为了解决小文本语料库在Hadoop平台存储中,出现上述分布式存储与检索速度间的矛盾问题,本文提出了一种新的HSCS(Hadoop Smalltexts Corpus Storage)存储策略.该策略首先使用小文本合并技术在HDFS架构中添加一层Merge_Client,将多个小文本文件合并为目录结构式的大文本文件,有效减少了内存压力和访问DataNode的次数:然后采用小文件检索技术,给合并后的大文本文件添加一个二级索引结构及

基于Hadoop平台的TFIDF算法并行化研究

基于Hadoop平台的TFIDF算法并行化研究 王静宇 赵伟燕 计算机工程与科学 2014年06期 基于Hadoop平台的TFIDF算法并行化研究

Hadoop平台上的海量数据排序(2)

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   使用Hadoop进行 GraySort基准排序时,Yahoo!的研究人员将上面的map/reduce应用程序稍加修改以适应新的规则,整个程序分为4个部分,分别为: TeraGen是产生数据的map/reduce程序: TeraSort进行数据取样,并使用map/reduce对数据进行排序: TeraSum是map/reduce程序,用来计算每个键/值对的CRC3

Hadoop平台上的海量数据排序(1)

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp;     Yahoo!研究人员使用Hadoop完成了Jim Gray基准排序,此排序包含许多相关的基准,每个基准都有自己的规则.所有的排序基准都是通过测量不同记录的排序时间来制定的,每个记录为100字节, 其中前面的10字节是键,剩余的部分是数值.MinuteSort是比较在一分钟内所排序的数据量大小,GraySort是比较在对大规模数据(至少 100TB)进行排序时

c/c++上传大文件到hadoop平台的效率选择

问题描述 学生党问一个问题...c/c++程序中要把大文件存储到hadoop平台上要怎么选择呢?1.readfile.openfileinhadoop.while(write())2.调用linux的系统操作命令 解决方案 解决方案二:http://hadoop.apache.org/docs/r0.19.1/libhdfs.html#include"hdfs.h"intmain(intargc,char**argv){hdfsFSfs=hdfsConnect("defaul

以更加智慧的方式整合至Hadoop平台

如果您认为 Hadoop 百分百准备好作为您的"单一版本事实"综合存储库,那么请三思而后行. 诚然,Hadoop 现已迅速发展成为大部分企业http://www.aliyun.com/zixun/aggregation/14294.html">的大数据战略核心组件.但它还不够成熟,无法完全取代企业数据仓库 (EDW).由于 Hadoop 的所有优势均集中作为非结构化数据集成层,因而绝大多数 Hadoop 环境缺乏强劲的安全性.可用性和治理性,而这些恰好是成熟 EDW 的

在CentOS版本的Linux上结合Hadoop平台安装mahout报错

问题描述 在CentOS版本的Linux上结合Hadoop平台安装mahout报错 在CentOS版本的Linux上结合Hadoop平台安装mahout运行时显示错误JAVA__HOME is not set怎么解决?Hadoop平台是1.2.1版本的:mahout是0.9版本的.如图是我的/etc/profile文件. 解决方案 http://blog.sina.com.cn/s/blog_5988cec90101g1p0.html 解决方案二: 你那图的最后一句javahome怎么又给设置成

基于Hadoop平台的随机森林算法研究及图像分类系统实现

基于Hadoop平台的随机森林算法研究及图像分类系统实现 厦门大学 梁世磊 本文结合Hadoop开源分布式计算平台,研究图像处理过程的并行化以及利用MapReduce并行计算模型对随机森林算法进行了分布式并行设计以提高对大规模图像分类的效率.首先,本文介绍了Hadoop平台,主要包括HDFS文件系统以及MapReduce框架:接着,分析了图像分类的关键技术,总结了图像分类中常用到的一些特征,重点介绍SIFT特征和BagofVisual Words特征代表的实现过程,并阐述了几类重要的模式分类方法

在CentOS版本的Linux上结合Hadoop平台安装mahout的配置错误

问题描述 在CentOS版本的Linux上结合Hadoop平台安装mahout运行时显示错误JAVA_HOMEisnotset怎么解决?Hadoop平台是1.2.1版本的:mahout是0.9版本的.如图是我的/etc/profile文件. 解决方案