大数据和HPC联手的三个关键途径

如今,大数据正变得越来越廉价,而不仅仅是广泛分布商品硬件上廉价的存储和计算。大数据分析可能很快成为高性能计算(HPC)新的“杀手级应用”。

此外,还有比大数据更多的大量的信息。它还涉及大量的分布式活动,如复杂的查询和计算。换句话说,通过计算获得的价值就像数据集本身的大小一样“大”。事实上,高性能计算大数据已经被分析公司IDC所创造,如“高性能数据分析。”

高性能计算(HPC)能很好地实现大数据典型的工作流程的所有三个阶段,包括数据采集和过滤,分析,结果可视化。除了这三个阶段,计算的速度和规模一样重要。为了发掘大数据的全部潜力,我们要以“大计算”与HPC进行匹配。

对于大数据和高性能计算的融合,以及企业如何充分利用这一现象来改善大型处理,以下有三个方法:

1.Hadoop联手Infiniband

许多人认为最常用的超级计算机互连技术InfiniBand,可以尽可能多满足HPC作为裸机处理的基本要求。如果不能快速移动节点之间的信息,就会限制了你可以实现的水平的可扩展性。远程直接内存访问(RDMA)的ApacheHadoop提供了一个极好的高速、低延迟互连的大数据平台。甚至可以在云端利用RDMA在任何时候提供一个Hadoop集群。由于其优越的带宽和延迟的优势,56Gbps的InfinibandFDR可能比10Gbps以太网速度甚至快100倍以上,短期使用非常昂贵的定制总线,这是跨节点的计算分布数据和处理的最快方法。最后,用户可以根据应用的大小可以扩展大数据平台,而不必担心几乎一样多的瓶颈。不仅会得到更快的结果,而其建立时间将远远小于所使用的商品网络技术。

2.Hadoop联手Accelerators

高性能计算(HPC)的另一个重要特点是采用了流行的协处理器和加速器,如被动式散热NVIDIATesla和开普勒的GPU。正如这些技术大大有助于技术计算解决方案的发展,他们还可以帮助大数据和分析,就像他们已经进行测序和比对。

Hadoop利用GPU技术,如CUDA和OpenCL可以大促进大数据性能的一个重要因素。所有其他的事情都是相同的,高性能的大数据平台和技术,如Hadoop,Spark,MapReduce导致复杂的分析和更快的结果。事实上,对于人们正在收集的数据量的不断增长的唯一方法是提高计算速度。大数据利用协处理器和加速器是HPC在这个空间具有更大的影响力的重要途径。

3.大数据和高性能计算在云计算的融合

大数据比任何其他应用程序推动公共云更快的增长,HPC需求成为了一个新兴的力量,并准备好迎接这一挑战。我们收集的数据越多,我们需要分析数据的计算能力就越大。简单地说,大数据和云计算的增长携手并进。只有这样,才能提供足够的规模,而跟上需求部署HPC类资产,以提高处理性能和密度。

得益于大数据平台的超级计算技术,如高速互连和协处理器的结合,组织可以利用和部署上的设计,使HPC服务成为了下一个主要需求分析的创新浪潮。采用分布式文件系统,如Hadoop,在相同的计算能力的情况下,可以加快测序和比对的过程,可以大大提高在今后的查询和比较的效率,并且其成本更加低廉。传统的HPC并行存储,经济学将变得更具吸引力。最后,采用具有时间价值和弹性规模的公共云,企业现在可以专注于他们的工作,而不是过于关注IT平台的性能。

由于大数据和高性能计算需求的衔接,企业将能够充分利用公共云计算的规模和可用性。

本文转自d1net(转载)

时间: 2024-10-23 01:36:37

大数据和HPC联手的三个关键途径的相关文章

让大数据产生高投资回报率的三个关键

根据IDC预测,全球大数据技术和服务市场将以31.7%的年均复合增长率(CAGR)增长,预计2016年大数据市场规模将达238亿美元.随着越来越多的公司进入大数据领域,企业迫在眉睫的问题是:你如何让大数据可操作? 更具体地说,就是C-lever的管理人员希望很快知道组织能否得到埋藏在庞大的大数据存储库中的"金块".大数据工作者也不希望处在很难获得"黄金"的位置.(从历史的角度来看,地质学家估计,1849年的加州淘金热,80%的黄金勘探者一无所获).这里有三种方式可以

大数据治理需要具备哪些能力和关键技术?

在企业数据建设过程中,大数据治理受到越来越多的重视.从企业数据资产管理和提升数据质量,到自服务和智能化的数据应用,大数据治理的内容在不断发展和完善,其落地实施的过程中会遇到各种各样的难题和挑战.本篇文章通过分析大数据治理建设中的沟沟坎坎,总结出了大数据治理需要具备的能力和关键技术. 一.困难重重却充满光明的大数据治理发展之路 1. 传统数据治理一直无法逃脱的魔咒 大数据治理从建设内容和实施目标上可以划分成不同的阶段,每个阶段完成不同的任务,随着阶段的递进,建设内容逐步加深,不同的企业切入点和诉求

大数据时代中国制造业的三个软肋

伴随着中国制造业在全球制造业中扮演的角色越来越重要,如何保持中国制造业的可持续发展,如何在全球范围内进行合理的资源配置和使用,如何进行设计.采购.制造.销售以及提供服务,从而实现利润的最大化?寻找适合企业自身发展的全球化战略和运营模式已经成为一个紧迫的议题. 记者获悉,在10月17日举办的以"中国智造业未来"为主题的第二届全球运营高峰论坛上,主办方特邀请来自企业和学术界人士,就智能化物流.大数据时代制造业的机遇与挑战.企业运营战略的升级.供应链中的服务创新等方面展开讨论与交流. 中国制

物流和大数据的结合,这三巨头强在哪?

说起物流大数据,你会想到什么? 因为量大,我首先想到的水,因为水会顺流而下,沿途支流不断汇集壮大,最后百川归海.同样地,数据流也会源源不断注入数据池.数据湖,于是有了信息海洋. 因为数据的多样性,然后我又想到了我们的思想,我总觉得每个人都有不同思想.这点跟在各行各业均存在大数据,但是众多的信息是纷繁复杂的一样,怎么处理.怎么分析.怎么总结其深层次的规律,变得尤为重要. 因为快速度,最后我想到的是闪电.记得英特尔中国研究院首席工程师吴甘沙就这么说过,"快速度是大数据处理技术和传统的数据挖掘技术最大

大数据那些事(2):三驾马车之永垂不朽的GFS

但凡是要开始讲大数据的,都绕不开最初的Google三驾马车:Google File System(GFS), MapReduce,BigTable.如果我们拉长时间轴到20年为一个周期来看呢,这三驾马车到今天的影响力其实已然不同. MapReduce作为一个有很多优点又有很多缺点的东西来说,很大程度上影响力已经释微了.BigTable以及以此为代表的各种KeyValue Store还有着它的市场,但是在Google内部Spanner作为下一代的产品,也在很大程度上开始取代各种各样的的BigTab

云计算和大数据将成为工程设计第三次革命的主要推动力

日前,Bentley公司召开2013用户年会,会上,Bentley公司表示,即将发布Bentley Connect产品,通过云计算技术,为工程设计的信息管理带来新的理念和手段. 随着"四化同步"战略的推进和智慧城市建设步伐加快,工程设计信息化方兴未艾,特别是云计算给工程设计带来新的机遇. "云计算.大数据等新兴信息技术为工程设计和管理提供新的信息化方法." -Bentley公司首席运营官Malcolm Walte "信息管理(IM)为工程设计带来第三次革命

个人不良资产如何有效处置?大数据帮你搞定三件大事

根据银监会披露的数据,截至2016年二季度末,我国商业银行不良贷款余额近1.4万亿元,商业银行不良贷款率1.81%,较上季末上升0.06个百分点,商业银行不良贷款率连续第12个季度上升,不良资产催收及处置压力不断增大. 同时,经过这些年的高速发展,互联网金融在不断磨合前进的过程中,不良资产比例也在快速增长,全行业的不良资产的规模已达数万亿级别.据<21世纪经济报道>近日报道,中国互联网金融行业协会拟定了P2P坏账界定标准,已经递交相关部门征求意见.因此,互联网金融机构面临不良暴露的风险,不良资

依托大数据 中国智能制造将“三步并作一步走”

中国智能制造的路径和方向渐渐浮出水面.在今天进行的全国智能制造试点示范经验交流会上,相关人士表示,中国要同步发展工业2.0.3.0.4.0,以三步并作一步走的方式,推进智能制造. 在工信部部长苗圩看来,我国智能制造已经在关键技术装备,标准体系建设等多个方面,取得了显著成绩.不过他同时指出,与发达国家相比,我们在这方面还有不小的差距. 苗圩:智能感知与控制技术.数字化设计与制造技术亟待提升.机器人.传感器等关键技术装备还受制于人.智能制造网络,信息安全基础还比较薄弱,系统集成解决方案提供能力不足.

降低大数据合规风险的三个要点

由于大数据众所周知,数据的数量和复杂性已大大增加,这与事务记录系统(SOR)的时代已不可同日而语.来自新数据源的这些新型数据,加上企业组织将数据变成其他信息的种种方式,给隐私.安全和妥善保管方面的合规实践带来了独特的挑战. 律师迈克尔·R·奥弗列(Michael R. Overly)早在2015年2月份在<CSO>杂志上的一篇文章中写道:"大数据合规方面的挑战,加上这越来越多的一堆乱糟糟的法律.监管.标准和合同义务,让人不知所措."奥弗列是富理达律师事务所(Foley &a