基于Hadoop的云计算模型研究及气象应用

基于Hadoop的云计算模型研究及气象应用

南京信息工程大学  张建

本文的主要工作如下: 首先对气象数据的特点进行分析,并指出将气象数据直接存储于Hadoop中存在的问题。根据气象数据的特点将设计基于Trie树变形的文件合并算法。在此基础上通过实验验证,数据高效率处理、安全等方面得到有效的提升和保障。 其次,设计并实现基于Hadoop的海量气象异构数据存储和计算框架,针对气象数据中实时提取有效数据的性能效率、数据保密安全、灾害备份等问题,利用HDFS存储气象数据以及利用MapReduce构建并行算法,将提出基于Hadoop的海量气象异构数据存储和处理框架。并通过实际业务中运行,将验证在并发数据处理上的效果,达到能有效降低成本和保证数据的安全的目标。 本文通过研究的模型与实际业务应用相结合,利用前沿的分布式技术来很好的满足项目中的需要,并将模型部署到实例当中,用实际运行结果来检验模型的实用价值。这些工作对大数据处理的研究有着重要的理论价值和实用价值。

基于Hadoop的云计算模型研究及气象应用

时间: 2024-09-18 22:29:07

基于Hadoop的云计算模型研究及气象应用的相关文章

云关键技术及基于Hadoop的云计算模型研究

引言 云计算是由企业界开始发展,然后才进入学术界引起重视的,这与网格计算相反.经过对迄今为止的云计算相关学术论文进行统计分析后,显示学术界对于云 计算的研究主要集中在云技术关键技术方面.云计算研究的关键技术包括虚拟机.安全管理.数据管理.云监测.能耗管理和计算模型等.云计算的计算模型是研究 如何针对某类应用特点提出效率更高的编程方式,目前云计算模型众多,而Hadoop是一个开源的分布式系统基本架构,正日益成为具有较强实用性的开发平 台.淘宝就是国内率先使用Hadoop的公司之一. 1 云计算关键

基于Hadoop的云计算与存储平台研究与实现

随着互联网技术的发展,数宇信息正在成指数增加,根据Internet Data Cente:发布的Digital Universe报告显示,在未来8年中所产生的数据量将达到40 ZB,相当于每人产生5200 G的数据,如何高效地计算和存储这些海量数据成为互联网企业所要而对的挑战.传统的大规模数据处理大多采用并行计算.网格计算.分布式高性能计算等,耗费昂贵的存储与 计算资源,而且对于大规模数据计算任务的有效分配和数据合理分割都需要复杂的编程才可以实现.基于Hadoop分布式云平台的出现成为解决此类问

基于Hadoop的云计算试验平台搭建研究

基于Hadoop的云计算试验平台搭建研究 张岩 郭松 赵国海 Hadoop是一个免费的开源云平台,是允许在集群计算机上分布式处理大数据的软件框架.它是一种可靠.高效.可伸缩的云平台,很适合在实验室环境下进行模拟测试.以Hadoop为基础,借助虚拟机VMware以及Linux.ubuntu.Hadoop.java-jdk等软件,详细地介绍了单机环境下的虚拟云平台搭建过程,并给出具体的实例搭建过程.在设计实例中详细的论述了虚拟机.java.Hadoop等软件的安装.设置.测试过程.实现了在实验室环境

基于信任的云计算安全模型研究

基于信任的云计算安全模型研究 山东师范大学 张艳东 云安全始终是云服务商不能不面对的软肋,它与云计算的发展前景息息相关.可以说,脱离了安全保障,云计算的应用及推广无从谈起.虽然传统的安全解决方案在一定程度解决了云计算中的安全问题,但完全将此套方案移植到云平台绝对不可取.由于云计算的高虚拟化程度,部署的复杂性以及高度的可扩展性等新特点,都促使我们必须研究适用于云计算的安全机制.其中信任问题是云计算推广面临的最大障碍之一,也即云用户和云服务商是否能够相互信任.针对上述问题,本文提出了相应的解决方案,

基于hadoop的hmm模型实现

问题描述 基于hadoop的hmm模型实现 哪位大神能帮我看一下,为什么我基于hadoop实现的hmm,输入总是报错?一开始报not a sequencefile ,然后我用mahout里面的seqdirectory把txt文件变成了sequencefile,接着又报java.lang.NullPointerException.我都要哭了,刚开始学hadoopimport java.io.IOException;import java.text.DecimalFormat; import org

基于HDFS的云计算安全技术研究与实现

基于HDFS的云计算安全技术研究与实现 广东工业大学  郭圣昌 本文创新点如下:(1)基于IBE算法原理,设计HDFS下DataNode对Client访问的身份认证安全机制,以弥补原有HDFS架构下Client访问DataNode未曾认证的缺陷,使得恶意或者仿冒用户无法在不经过主服务器NameNode的情况下窃取DataNode上的私人数据,保证了数据安全.同时,采用类IBE算法原理,摒弃了第三方可信机构,私钥由客户端Client自主产生,减少了因密钥生成.分发和存储带来的密钥管理复杂性,简化了

[文档]基于P2P的云计算模型及其安全性分析

基于P2P的云计算模型及其安全性分析 沈静波  李金龙 文章通过将P2P技术和云计算相结合,提出了一种可靠的.可扩展的.低成本的文件共享模型PA-Cloud.该文介绍了PA-Cloud的文件下载和更新过程,并对系统的安全性进行了分析.通过对PA-Cloud进行对比实验表明,PA-Cloud可以有效提高系统的可扩展性,降低服务提供商的成本. 关键词: 对等网络 云计算 文件共享 可扩展性   temp_12060215109101.pdf

中国人工智能学会通讯——基于众包的数据清洗模型研究 3. 实验

3. 实验 本章我们将在真值发现和缺失填充两个数据清洗代表性应用上,验证提出模型的高效性和准确性. 数据集: (1)stock.该数据集收集了2011年7月的所有工作日约1 000只股票的信息,其中包括分别来自55个数据源的16个属性.我们用该数据集验证提出的模型,在真值发现应用上的有效性. (2)wine.该数据集包括200条记录,13个属性.我们用该数据集验证提出的模型,在缺失填充应用上的有效性. 实验设置:所有的实验在Intel(R) Core(TM) i5-2400 (3.10 GHz)

基于Hadoop的云安全存储系统的设计与实现

基于Hadoop的云安全存储系统的设计与实现 广东工业大学  蒋向阳 云计算是分布式计算.并行计算和网格计算的发展,给人类生活.生产方式和商业模式带来根本性改变,是当前全社会关注的热点之一.云存储是从云计算概念上延伸发展出来的一个新的概念,它是指通过集群应用.网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统.随着云计算技术与云存储技术的广泛应用,其存在的安全问题不断突显出来,安全问题已成为阻碍云计算和云存