Hadoop平台上煤矿企业储备定额算法并行化研究与应用

Hadoop平台上煤矿企业储备定额算法并行化研究与应用

内蒙古科技大学张翔

本文提出基于Hadoop云计算平台的备件消耗量预测系统。该系统分为数据获取模块、数据存储模块、数据预处理模块和备件消耗量预测模块四部分。其中,数据获取模块利用某煤炭集团公司的ERP系统Web Service接口来获取用户数据;数据存储模块中将数据获取模块中获取的备件数据按设计的数据格式存入本地Oracle数据库中;数据预处理模块利用VS2010开发程序将数据库中备件数据按要求进行处理,得到我们需要的数据格式的数据,通过多层次模糊综合评价法,从备件的关键性和备件所属设备的关键性两方面对备件重要性进行评价,量化备件重要性得到所需的裕度系数K;备件消耗量预测模块中对备件消耗量预测方法（概率统计分析法）进行改进,以经典矩阵相乘的经典算法为基础,利用MapReduce编程框架进行MapReduce化设计,构建MapReduce并行处理算法并在MapReduce并行编程模型上实现。实验结果表明,经过MapReduce设计的算法在处理器的可扩展性、数据的可扩展性和加速比性能这三方面的实验中具有良好的指标,算法性能表现良好。

Hadoop平台上煤矿企业储备定额算法并行化研究与应用

时间： 2024-07-31 21:32:23

Hadoop平台上煤矿企业储备定额算法并行化研究与应用的相关文章

小文本语料库在Hadoop平台上的存储策略研究

小文本语料库在Hadoop平台上的存储策略研究华中师范大学郑丽洁为了解决小文本语料库在Hadoop平台存储中,出现上述分布式存储与检索速度间的矛盾问题,本文提出了一种新的HSCS(Hadoop Smalltexts Corpus Storage)存储策略.该策略首先使用小文本合并技术在HDFS架构中添加一层Merge_Client,将多个小文本文件合并为目录结构式的大文本文件,有效减少了内存压力和访问DataNode的次数:然后采用小文件检索技术,给合并后的大文本文件添加一个二级索引结构及

基于Hadoop平台的TFIDF算法并行化研究

基于Hadoop平台的TFIDF算法并行化研究王静宇赵伟燕计算机工程与科学 2014年06期基于Hadoop平台的TFIDF算法并行化研究

Hadoop平台上的海量数据排序（2）

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; 使用Hadoop进行 GraySort基准排序时,Yahoo!的研究人员将上面的map/reduce应用程序稍加修改以适应新的规则,整个程序分为4个部分,分别为: TeraGen是产生数据的map/reduce程序: TeraSort进行数据取样,并使用map/reduce对数据进行排序: TeraSum是map/reduce程序,用来计算每个键/值对的CRC3

Hadoop平台上的海量数据排序（1）

&http://www.aliyun.com/zixun/aggregation/37954.html">nbsp; Yahoo!研究人员使用Hadoop完成了Jim Gray基准排序,此排序包含许多相关的基准,每个基准都有自己的规则.所有的排序基准都是通过测量不同记录的排序时间来制定的,每个记录为100字节, 其中前面的10字节是键,剩余的部分是数值.MinuteSort是比较在一分钟内所排序的数据量大小,GraySort是比较在对大规模数据(至少 100TB)进行排序时

c/c++上传大文件到hadoop平台的效率选择

问题描述学生党问一个问题...c/c++程序中要把大文件存储到hadoop平台上要怎么选择呢?1.readfile.openfileinhadoop.while(write())2.调用linux的系统操作命令解决方案解决方案二:http://hadoop.apache.org/docs/r0.19.1/libhdfs.html#include"hdfs.h"intmain(intargc,char**argv){hdfsFSfs=hdfsConnect("defaul

以更加智慧的方式整合至Hadoop平台

如果您认为 Hadoop 百分百准备好作为您的"单一版本事实"综合存储库,那么请三思而后行. 诚然,Hadoop 现已迅速发展成为大部分企业http://www.aliyun.com/zixun/aggregation/14294.html">的大数据战略核心组件.但它还不够成熟,无法完全取代企业数据仓库 (EDW).由于 Hadoop 的所有优势均集中作为非结构化数据集成层,因而绝大多数 Hadoop 环境缺乏强劲的安全性.可用性和治理性,而这些恰好是成熟 EDW 的

在CentOS版本的Linux上结合Hadoop平台安装mahout报错

问题描述在CentOS版本的Linux上结合Hadoop平台安装mahout报错在CentOS版本的Linux上结合Hadoop平台安装mahout运行时显示错误JAVA__HOME is not set怎么解决?Hadoop平台是1.2.1版本的:mahout是0.9版本的.如图是我的/etc/profile文件. 解决方案 http://blog.sina.com.cn/s/blog_5988cec90101g1p0.html 解决方案二: 你那图的最后一句javahome怎么又给设置成

基于Hadoop平台的随机森林算法研究及图像分类系统实现

基于Hadoop平台的随机森林算法研究及图像分类系统实现厦门大学梁世磊本文结合Hadoop开源分布式计算平台,研究图像处理过程的并行化以及利用MapReduce并行计算模型对随机森林算法进行了分布式并行设计以提高对大规模图像分类的效率.首先,本文介绍了Hadoop平台,主要包括HDFS文件系统以及MapReduce框架:接着,分析了图像分类的关键技术,总结了图像分类中常用到的一些特征,重点介绍SIFT特征和BagofVisual Words特征代表的实现过程,并阐述了几类重要的模式分类方法

在CentOS版本的Linux上结合Hadoop平台安装mahout的配置错误

问题描述在CentOS版本的Linux上结合Hadoop平台安装mahout运行时显示错误JAVA_HOMEisnotset怎么解决?Hadoop平台是1.2.1版本的:mahout是0.9版本的.如图是我的/etc/profile文件. 解决方案

猜你喜欢

JavaScript中的字符串操作

javascript|字符串一.概述字符串在JavaScript中几乎无处不在,在你处理用户的输入数据的时候,在读取或设置DOM对象的属性时,在操作cookie时,当然还有更多....Jav ...

银杏树价格网优化方案分析

春节后由于忙于生活琐事一直没有开始工作,所以文章更是写的少的可怜.本来想写一篇年底总结来着,但是打开博客点击"新建文章"后却又一个字都不想打,看来是休假休的人变得更懒了.既然懒的对 ...

PS制作三维文字

在这个快速简洁的图形设计教程中,你会在Photoshop和一些创意技术的帮助下用一个方便的过程实现很棒的三维图像效果. 最终效果就是最上面的那张啦 . 做3D文字最基础的教程,原作者有够罗嗦,文章来自 ...

PS合成PUNK颓废效果海报

PUNK(庞克)风格主要以:黑.白.红三色为主调, 如果色彩太鲜艳就不像庞克风格了,所以不需要加渐变或高光的素材.而且选用人物素材时,人物最好也是酷酷的,清纯可爱的不太适合做PUNK风,不然应该会怪怪 ...

win7系统下载文件没有出现下载对话框怎么办

由于这个问题是跟另外一个xp系统出现这个问题是一样的所以我把那边的问题直接复制过来了.xp系统下载文件没有出现下载对话框问题的具体描述:下载的文件通常是压缩文件,其他类型的文件小编没去尝试.因为这是 ...

Win8.1资源管理器库丢失如何找回

在之前的Windows 8.1内部测试版中,我们早已经惊奇的发现在Windows 8.1系统中,"库"功能消失了!其实不然,微软并没有将"库"功能删掉,而是将其 ...

如何恢复win7系统ie浏览器意外关闭掉的网页

ie浏览器意外关闭,这应该是比较常见的问题了,特别是遇到网速很慢或者是电脑卡机的时候,经常都会遭遇到ie浏览器意外关闭,那么ie浏览器意外关闭之后,之前打开的网页还能恢复吗?下面小编就来告诉大家一 ...

Win7如何限定U盘防止病毒运行

1.把自己经常使用的USB设备插入电脑中,设备进入正常运行状态后,"打开控制面板硬件和声音设备和打印机",在此窗口中可看到所有设备. 右击一个USB设备,选择属性,在打开窗口中 ...

Windows7桌面的快捷方式都变成了相同的图标怎么办

解决方案: 按组合键"Win+R"调出运行命令框,在"打开"栏中键入regedit.exe,回车,打开注册表编辑器. (本部分涉及注册表的更改,请于操作前对 ...

fedora 9下驱动摄像头采集图像手记

最近一个月,在做视屏图像采集方面的项目.我安装了的是fedora 9.在fedora 9下让摄像头采集数据可谓是费尽了我半个月的时间.看似简单的问题,不知道我为什么做了这么长时间. 首先,摄像头 ...

本地邮件传输协议：SMTP和LMTP

SMTP需要管理一个队列,一个邮件操作可以把一封邮件发送向不同的接收者,而一个SMTP命令却只有一个返回码,这就带来的问题,如果服务器需要把一个邮件发向两个接收者,发送第一个的时候成功了,而发送第二个 ...

C++开发者都应该使用的10个C++11特性

在C++11新标准中,语言本身和标准库都增加了很多新内容,本文只涉及了一些皮毛.不过我相信这些新特性当中有一些,应该成为所有C++开发者的常规装备.你也许看到过许多类似介绍各种C++11特性的文章.下 ...

远程连接-关于阿里云服务器的，请问这是什么问题？

问题描述关于阿里云服务器的,请问这是什么问题? ,阿里云服务器远程连接不上,然后用管理终端一进去就是ServerManager已停止运行.Windows Server2012的系统,求大神解决解决 ...

[Google Guava] 2.3-强大的集合工具类：java.util.Collections中未包含的集合工具

原文链接译文链接译者:沈义扬,校对:丁一尚未完成: Queues, Tables工具类任何对JDK集合框架有经验的程序员都熟悉和喜欢java.util.Collections包含的工具方法.G ...

中国手机ODM厂商实力可观 VR和物联网是未来发展新蓝海

中国手机企业的强大是有目共睹的,那么,在整个手机产业链当中,发展潜力最大的部分是什么呢?目前来看,手机ODM企业,也就是手机设计代工企业当属其中之一.什么是ODM呢?闻泰通讯企划部总监邓安明对此作出解 ...

中国部分城市地震危险度排名

信息时报报道,广东科技馆举办的"地震与思考"地震科普图片"巡展"展示了中国部分省级城市地震危险度排名的数据,该数据来源于北京师范大学环境演变与自然灾害教育部重点 ...

Windows 版本号的故事

中介交易 http://www.aliyun.com/zixun/aggregation/6858.html">SEO诊断淘宝客云主机技术大厅这是微软副总裁, 主管 Windo ...

今日头条做电商，无奈之下的选择

摘要:在移动端,哪些形式比较容易变现呢?电商.游戏.广告.今日头条做电商与其说是战略布局,还不如说是无奈之下的选择. 今日因版权纠纷问题而备受关注的今日头条又有了新的动作,一些电商已经受到其邀请参加一 ...

c++-CString类型变量的输入。

问题描述 CString类型变量的输入. CString ziduan=""; CString value=""; printf("请输入要查询的字段 ...

apk签名丢失问题，用户升级时可否自动卸载旧的包再安装？

问题描述 apk签名丢失问题,用户升级时可否自动卸载旧的包再安装? 现在有个问题,之前用于打包的数字签名文件因为硬盘坏掉找不回来了 1.通过之前的打的apk能否重新找回签名文件? 2.如果找不回来,重 ...

c语言-用C语言验证以下算子，求大神帮助啊

问题描述用C语言验证以下算子,求大神帮助啊 void __sb_q_vmac (volatile __sb_vect4x40s_t *, const volatile __sb_vect4x16s_ ...

好友列表的搜索功能

问题描述我从环信服务器获取出好友的用户名,然后从自己的服务器上取出好友对应的昵称.可是搜索好友该怎么弄呢?demo中是根据用户名搜索的,如何才能根据昵称搜索? 解决方案搜索是UI层控制的,并不 ...

Wii得到了美国心脏协会的认证为健康游戏

任天堂的Wii 游戏机近日得到了美国American Heart Association 的认证,一些健康运动类的Wii 游戏将会加上AHA 的LOGO 以表示这是该协会推荐的健康游戏. 同时作为合约 ...

jquery jqPlot API 中文使用教程(非常强大的图表工具)_jquery

jqPlot是一个非常强大的图表工具,曲线,柱状,饼图,应该有尽有,更要命的是,调用方便~~ 官网:http://www.jqplot.com/ 这里贡献上中文教程,基本上所有的api都很齐全,供有需 ...

asp.net中c#自定义事件的方法和步骤

通常C#自定义事件有下面的几个步骤: 1.声明一个delegate: (用于事件的类型的定义) 如: public delegate void 事件名称EventHandler(object serd ...

哪位高手能帮忙，看下该如何实现下面的功能（vb.net或是c#）编写都可以

问题描述 2.输入工程基本参数:杆号.档距.导线悬挂点高差(右侧杆塔悬挂点高为正值,反之为负值).转角度数:3.选择放线区段,先输入杆号为张力场,后输入杆号为牵引场:4.输入张力场.牵引场与相邻杆塔的 ...

怎么把文字替换为超链接呢？

问题描述把文字直接转化成完整的<ahref="">,超链接用asp.net写的,@Html.ActionLink,生成的是相应的<ahref="&qu ...

ssh如何开发服务监控程序

问题描述如何在tomcat服务器启动后就监控数据库,用来定时发送邮件.短信.消息等,这个监控服务应该如何实现或给我点提示? 解决方案你的意思应该就是在tomcat启动后监控数据库某个表,然后定时发 ...

M.2 SSD正在走向服务器

目前已经作为连接SD卡和SATA SSD的桥梁部署在超级本和平板电脑中了.随着其在容量(计划超过10TB)和速度(接近SATA)上的不断提升,M.2 SSD已经准备好在服务器层面大展拳脚了. 考虑到S ...

有光就能上网！号称比Wi-Fi牛的Li-Fi是什么？

即使你从来没有听说过 Li-Fi,你现在也可以知道它到底是个什么东西.Li-Fi(Light Fidelity)是一种新型无线网络连接技术,它是主要通过可见光频谱来实现无线数据的传播.这项激动人心的技 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.022 s.