基于云计算的并行K-means气象数据挖掘研究与应用

基于云计算的并行K-means气象数据挖掘研究与应用

南京信息工程大学潘吴斌

聚类分析是数据挖掘中的一个重要研究领域,它将数据划分成若干个聚类,使得在同一聚类中的对象比较相似,而不同聚类中的对象差别很大。K-means算法被认为是最经典的基于划分的聚类方法,常采用误差平方和准则函数作为聚类准则,该算法在处理数据集上相对可伸缩且高效率。但面对大规模数据时,运算量也随之增加,运算所需的资源和时间耗费明显增大。为了突破这个瓶颈,通过分析和研究得知,与传统的并行计算模型相比,MapReduce分布式计算模型封装了并行处理、容错处理、本地化计算、负载均衡等细节,还提供了一个简单而强大的编程接口,极大的简化了并行程序设计的难度,采用MapReduce进行并行程序开发时,用户只需关注于自身要解决的并行计算任务。因此,利用Hadoop平台处理海量数据的优势,提出了一种改进的算法,在Hadoop平台上实现K-means算法的MapReduce并行化。最后,通过聚类结果的有效性、加速比以及可扩展性对基于MapReduce的并行K-means算法进行评估。

基于云计算的并行K-means气象数据挖掘研究与应用

时间： 2024-10-25 03:34:20

基于云计算的并行K-means气象数据挖掘研究与应用的相关文章

基于云计算平台的随机森林算法的研究与实现

基于云计算平台的随机森林算法的研究与实现于延王建华随着网络时代海量数据的日渐普及,从中挖掘出有价值的信息成为当今社会的研究热点.本文针对构建随机森林的数据挖掘算法,提出了基于海量数据的分布式可扩展随机森林算法.该算法基于MapReduce分布式计算模型,可以高效地分析.处理海量数据,并且能够准确地对数据进行分类预测.大量的实验结果表明,本文提出的算法具有很好的可扩展性及高效性. 基于云计算平台的随机森林算法的研究与实现

基于Hadoop的并行共享决策树挖掘算法研究

基于Hadoop的并行共享决策树挖掘算法研究陈湘涛张超韩茜共享知识挖掘是指通过学习不同事物之间的共享知识,将学习到的知识应用到未知事物来加快认知未知事物.针对大数据集中串行共享知识挖掘算法效率低下的问题,结合云计算技术,提出了一种基于Hadoop的并行共享决策树挖掘算法(PSDT).该算法采用传统的属性表结构实现并行挖掘,但其I/O操作过多,影响算法性能,为此,进一步提出了一种混合并行共享决策树挖掘算法(HPSDT).该算法采用混合数据结构,在计算分裂指标阶段使用属性袁结构,在

基于云计算的信息系统数据采集分析系统的研究与设计

基于云计算的信息系统数据采集分析系统的研究与设计李东辉方方吴小志朱广新茹萌从云计算三个层次的服务模式出发,提出了一种基于云计算平台的分布式并行信息系统数据采集分析系统.首先,通过Hadoop云计算平台提供的分布式文件系统提升数据的存取速度,增强系统的容错性.在此基础上,利用MapReduce编程模型并行化数据流系综分类算法,提高数据的分类挖掘效率.最后,采用Web Service技术构建了SOA服务体系架构,从而整合了技术平台.测试结果表明,检测系统运行高效,并且检测精度高,具有一定

基于云计算的数据查找与加密方案研究

基于云计算的数据查找与加密方案研究于延,王建华,孙惠杰云计算环境下的数据查找与加密技术是目前的研究热点.针对现有方案的不足,本文提出了一种改进的数据查找与加密方案.在数据查找方面,本文首先建立了身份管理模型,然后提出了基于权限的身份鉴别算法来实现从系统资源到身份数量之间的最优指派:在数据加密方面,提出了一种可计算加密方案 CES,该方案能支持云数据的模糊检索和基本算术运算,有效地对用户的敏感数据进行隐私保护.仿真实验结果表明,本文的方案是有效的,在加.解密性能以及存储与通信开销等方面要优于传

基于云计算的PC数据同步备份的研究与实现

基于云计算的PC数据同步备份的研究与实现吴毓陈军华为了更好地保证数据安全性.完整性及方便数据的异地管理,从本地数据库和个人数据角度出发,以数据备份为重点,利用微软云端数据库管理系统SQL Azure和应用程序开发工具Visual Studio,设计并实现了基于微软Windows Azure云环境下的PC数据同步备份系统,并借此平台发布和部署了该系统的Web门户网站.实验测试表明:相比于其他非云环境下的数据备份方法,该系统在移动性.操作性和数据管理等方面具有一定的优势和研究价值. 基

基于云计算的云采购成本结构优势研究

基于云计算的云采购成本结构优势研究林国龙黄莉丁一姚锦元将云计算运用到采购中,构建云采购平台,并且将云采购与传统采购模式进行成本比较.通过采购成本模型的建立与分析,认为云采购模式在成本上具有较大的优势.依托云安全技术,云采购在信息的传递准确率以及时间上有绝对的优势,同时云采购平台对虚拟资源的智能分配可使采购方删除大量无价值采购环节.最后通过算例对所提出的理论进行验证,表明云采购具有较大的优势,特别是对中小型企业,在面临自建企业信息平台时,云平台无疑是一个较好的选择. 基于云计算的云

基于云计算的数字取证关键技术的研究与实现

基于云计算的数字取证关键技术的研究与实现吉林大学谢珍真本文将云计算技术引入到以网络流量为目标的数字取证问题中,首先对云计算的背景知识和数字取证的背景知识进行了概要介绍,并着重描述了Hadoop2.2的优势,以及选择这一版本作为基础平台的原因:其次对map-reduce和yarn架构进行了阐述,给出了基于云计算的网络流量数字取证模型,并对前人提出的分布式SVM算法进行了总结,以之前的算法作为基础,提出了一种改进后分布式SVM算法作为网络流量算法,经过实验验证了其有效性和准确性,并给出了实验过

基于云计算数据集成模式的矿井瓦斯预警研究

基于云计算数据集成模式的矿井瓦斯预警研究西安科技大学张杰矿井瓦斯一直是我国煤矿主要的灾害形式之一,并严重困扰着煤矿的安全生产.研究矿井日常检/监测数据的有效处理及其预测预警应用,有利于拓展安全监测监控系统的功能,是提高瓦斯灾害预警能力的重要手段.本论文在分析矿井瓦斯检/监测数据特征及其集成管控模式的基础上,深入研究了基于云计算数据集成模式下的矿井瓦斯预警分析理论和方法. 研究了矿井瓦斯检/监测数据的特点及其集成管控模式.分析了瓦斯检/监测数据的特征,并对于环境.人为.管理等因素影响下存在

[文档]三网融合下基于云计算的实时转码技术的研究和应用

三网融合下基于云计算的实时转码技术的研究和应用包盛段保通邵锋军本文将探讨三网融合下视频内容的实时转码技术,通过该技术实现视频内容的在线实时转换和匹配,使得转换后的视频内容能够在各类终端上进行播放,同时基于云计算技术,搭建实时转码服务平台,为各类终端用户提供易用.开放.快速高效的融合视频服务. 关键词: 三网融合实时转码云计算 temp_12051107496046.pdf

猜你喜欢

PhotoShop“相加”和“减去”模式精确选择颜色

一.关于"相加"模式 "相加"模式的公式:[(源1+源2)/缩放]+补偿值=结果从公式看,结果可以通过缩放值和补偿值进行调整,如果缩放为1,补偿值为0,那么结 ...

NetBeans VS Eclipse,新一轮的争端

从前不久开始, www.theserverside.com ,www.javalobby.org ,dev2dev论坛等多个Java论坛上争论着一个非常激烈的话题:Why Eclipse Develo ...

ASP 分页操作, 改良版

分页效果:首页上十上一 11 12 13 14 15 16 17 18 19 20 下一下十尾页转到___ 11/20页 963篇主文件: dateview.asp , 查询参数 y ...

Web环境下MS SQL Server中数据的磁带备份与恢复

server|web|备份|恢复|数据摘要:介绍了磁带数据备份及恢复的工作过程,包括在硬盘上建立了一个与磁带的容量相当的数据库,即桥数据库和在Web信息系统中要实现完整的磁带数据备份及恢复功能.从 ...

C#—非对称加密：加密文件

加密 C#-非对称加密:加密文件★★★★★★ ☆☆☆ ★★★★★★●●○○ 聂永 ○○●●§§§§nie_yong@163.com§§§§◆◆□□nie.yong@126.com□□◆◆№№№№№№ ...

如何设置无线路由器

现在的无线产品便宜了,很多家庭都购买了无线产品充分享受无线上网的乐趣.很多用户经常会遇到无线路由器的设置问题,这些问题导致最终无法上网.一般而言,不同的无线路由器设置也不太相同, 但设置原理相互之间不 ...

.NET设计模式（2）：单件模式（Singleton Pattern）

概述 Singleton模式要求一个类有且仅有一个实例,并且提供了一个全局的访问点.这就提出了一个问题:如何绕过常规的构造器,提供一种机制来保证一个类只有一个实例?客户程序在调用某一个类时,它是不会考 ...

如何对演示文稿PPT加密

方法一:文件菜单设置: 1.打开需要加密的PPT; 2.选"文件"的"另存为",出现"另存为"对话框,在"工具"中选&q ...

Windows8如何创建图片密码？

Windows 8允许用户创建图片密码,选择一个图片,然后在上面拖动绘制出波浪线.直线和圆圈组合,此后,只有能够重现此模式的人才能够登录系统. 点击控制面板-用户-创建一个图片密码. 按照提示进行 ...

win8怎么添加好用的开始菜单

在之前的win8优化大师使用教程中,我们为大家分享了win8优化大师的特色功能,其中不少网友都对win8优化大师添加开始菜单的功能非常感兴趣,那么,win8优化大师怎么给win8系统添加开始菜单呢 ...

svchost.exe应用程序错误的解决方法

svchost.exe应用程序错误的解决方法: svchost.exe是微软Windows操作系统中的一个系统程序,其微软官方对它的解释是:svchost.exe是从动态链接库(DLL)中运行的服务的 ...

如何进入CMOS设置?

在开机后,当显示屏有显示信号出现时,按下键盘上的PAUSE键,并仔细察看显示信息中关于进入CMOS的提示,如还未出现,则可以按ENTER键,继续开机进程,并当CMOS提示出现时,随时按下PAUSE ...

mri-DICOM中窗宽窗位的调节

问题描述 DICOM中窗宽窗位的调节有关于核磁共振MRI的窗宽窗位调节的资源吗?麻烦各位发个链接,谢谢解决方案 DELPHI 对DICOM中的窗宽.窗位调整DELPHI 对DICOM中的窗宽.窗位 ...

教你如何肉眼识别网站流量大小（交换链接必杀技巧）

怎样才能知道对方的流量呢? 如果您不是太菜的话略过这一段:记得先前有一些无良的人,采用在自己页面最下方放一个累加器的土办法,显示的数儿,贼忒高,类似的做法好像流量了一段,咱告诉您,这是绝不可相信的.信 ...

HBase和Cassandra比较

HBase是一个开源的分布式存储系统.他可以看作是Google的Bigtable的开源实现.如同Google的Bigtable使用Google File System一样,HBase构建于和Googl ...

zendesck,rest，json

问题描述 zendesk怎样使用restapi?有人用过rest,json吗?感觉好陌生,api上都不知道写了些啥?

javascipt在ASP.net中运用的问题

问题描述我在jsp中运用javascipt写了一个页面,但将javascipt部分的全部代码复制到asp.net中运行却呈现出空白页面,请问javascipt在jsp和asp.net中的运用有什么区 ...

Lucene5学习之Directory理解

Directory即Lucene中对索引目录的一个抽象,体现到API上,它被设计为一个抽象类,类里面定义了一些抽象方法,如listAll列出目录下所有文件,deleteFile(String name ...

请问该程序运行后行数是几行？

问题描述 Publicclassexample{Publicstaticvoidmain(string[]args){inti,j;for(i=0,j=0;i+j<20;++i,j+=i)Sys ...

数据表-xampp wordpress在配置数据库时不断的出现，要允许本页面自动修复数据库问题。

问题描述 xampp wordpress在配置数据库时不断的出现,要允许本页面自动修复数据库问题. 要允许本页面自动修复数据库问题,请将下面一行加入您的wp-config.php文件.完成后请刷新本页 ...

传奇制作人约翰·卡马克展示“火箭计划”最新进度

多玩网讯(编译/于子将)在达拉斯的QuakeCon2010上,传奇制作人约翰·卡马克展示了他的"火箭计划"的最新进度,他希望能在本月再次试射.从理论上讲,他设计的新型火箭能够上升到 ...

局部变量-javascript 定时器和变量相关忘好心人前辈帮忙看一下。

问题描述 javascript 定时器和变量相关忘好心人前辈帮忙看一下. <!DOCTYPE html> <html lang="en"> <hea ...

三星销量“不好看” 小米蚕食客户

据国外媒体报道,上周,三星首席财务官李尚勋(LeeSangHoon)警告称,三星第二季度财报不会"太好看".三星没有解释原因,但鉴于三星对手机业务部门利润的依赖,手机销售疲软可能是 ...

Go语言服务器开发之客户端向服务器发送数据并接收返回数据的方法_Golang

本文实例讲述了Go语言服务器开发之客户端向服务器发送数据并接收返回数据的方法.分享给大家供大家参考.具体实现方法如下: 复制代码代码如下: package mysocket import ( ...

innerHTML,outerHTML,innerText,outerText的用法及区别解析_javascript技巧

<p><div id="div" style="background-color:#ff9966;border:1px #ff0000 dashed;& ...

Android界面效果UI开发资料汇总(附资料包)_Android

简介: Android界面效果UI开发资料汇总 1. Android_UI开发专题.rar 2. android界面效果全汇总.rar 对于Android平台的资源类android.content.r ...

JavaWeb中struts2实现文件上传下载功能实例解析_java

在做B/S系统时,通常会涉及到上传文件和下载文件,在没接struts2框架之前,我们都是使用apache下面的commons子项目的FileUpload组件来进行文件的上传,但是那样做的话,代码看起来 ...

php获取文件名后缀常用方法小结_php技巧

本文实例汇总了php获取文件名后缀常用方法.分享给大家供大家参考.具体实现方法如下: <?php header("Content-type:text/html;charset=utf- ...

网易易盾：以人工智能技术提升UGC产品内容安全

[51CTO.com原创稿件]互联网发展至今,已经成为人们的必需品.我们无论是在工作还是生活中,都会使用互联网.在Web 2.0时代,用户原创内容UGC大量出现,然而,一些垃圾信息.广告.色情图片等内 ...

rest api 群组黑名单问题

问题描述调用rest api 群组添加黑名单接口 /{org_name}/{app_name}/chatgroups/{group_id}/blocks/users/{username}结果: 用户 ...

热搜

© 2024 iVAN | info#iamivan.net | 11 q. 0.017 s.