横向扩展NAS迎战大数据的5大原则

对将">非结构化数据转化为可操作的商业智能的美好前景感到兴奋?你需要做的第一步是创建一个可以处理PB级数据的820.html">存储架构。EMCIsilon的Nick Kirsch表示,横向扩展NAS(网络附加存储)是最佳解决方案,他还为首席信息官提供了用以判断横向扩展NAS的五个原则。

随着企业开始进军大数据世界---数字化纸张文件和保存电子邮件通信,Word文档、Excel文件和各种其他非结构化数据都可能转变成可操作的商业智能,不过企业首先需要解决一个大问题:存储。

“企业累积了越来越多的数据,信息量达到PB级,”EMC Isilon公司产品管理主管Nick Kirsch表示,“他们面临着类似的挑战:他们面对如此庞大的信息量,他们该如何利用?他们该如何将这些信息存储在可扩展的架构中?”

一种可能性是垂直扩展。垂直扩展也就是使用新的高容量设备替换你现有的存储设备,让你现有的存储节点变大变快,甚至更强大。以这种方式来加强存储基础设施很有吸引力,因为这种方式简化了管理,并减少了占地空间和电力消耗。但是这种方式并非没有问题:它不能简单地跨越多个地点,它没有很多固有的整体灵活性,并且大型高性能存储设备价格很昂贵,在处理不断增加的信息洪水时,最大的问题就是现在的存储设备只有那么大。

“你可以建立越来越大的单一单元控制器,”Kirsch表示,“但是在某些时候,你不能够让系统变得更大,你必须添加第二个系统,最终你可能需要管理数百个独立单元。”

Kirsch表示,水平扩展(横向扩展)NAS是一个不错的选择。横向扩展NAS架构没有选择昂贵的高容量存储设备来作为存储元件组合到总存储池。横向扩展NAS并不是让节点变得更大,你按照需要来添加节点。这种方法的缺点就是你可能很快就会面临一个更为复杂的管理环境。但是这种方式可以跨越多个地点,并且有很大的固有灵活性。也许从管理大数据的角度来看,最重要的事情在于你能够快速地低成本地添加存储。

Kirsch表示:“当涉及存储时,人们最大的抱怨就是真的很容易管理单个单元,但是当你有两个或者更多单元时,管理就变得很复杂。”

对于大数据,NAS是比SAN更好的选择,Kirsch表示,因为SAN并不是为非结构化数据和文件共享而建立的。为了与网络协议(例如NFS或者CIF/SMB)一起使用SAN,然而,你必须在SAN前面部署文件服务器,这会增加管理复杂性,并会影响可扩展性。

横向扩展NAS的五个原则

Kirsch为首席信息官选择横向扩展NAS架构提供了以下五个原则,宗旨是简单至上:

易于扩展 “企业需要选择的下一代存储架构应该是易于扩展的,”Kirsch表示,“如果我有1TB驱动器,这就是我可以管理、可以保护和可以复制的数据卷。为什么管理15PB数据不能也像这么简单?不能因为数据量变大了,事情就变得复杂了。”横向扩展架构可以通过软件管理和虚拟化/抽象层(让这些节点像单个系统一样)来解决这个问题。

可预见性 “性能应该是具有可预见性的,”Kirsch表示,如果我这周增加了6TB,下周增加了6TB,我希望在性能方面具有相同的线性可扩展性。我不希望还要重新设计我的应用程序或者重新教育我的用户。应该以可预见性的方式来扩展。我希望根据预测的增长情况来增加开支,不要让我过分投资。我知道摩尔定律下个月将会让我们实现更快的计算速度,并且驱动器也会随着时间的推移密度变得更大。下一代存储架构最好能够利用我现有的存储基础设施的优势,并且应该是共享对称架构。不要试图让我了解你的架构的差异,让我根据需要来扩展系统。

有效性 “让我利用我的存储系统中的所有资源,无论它们在什么位置,”Kirsch表示,“让我充分利用我的物理磁盘驱动器,不是50%或者55%,而是80%以上的存储利用率。无论CPU、计算或缓存在哪里,我能够利用它们。我想要存储系统最大化利用应用程序的性能。另外,请将分层整合到存储系统。”换句话说,你需要移动数据来优化性能或者优化容量。对付大数据的横向扩展NAS应该具备足够的智能能够将这一过程自动化。

可用性 “它必须是在任何时间都可用的,”Kirsch表示,“利用N-way架构的优势。让我能够从两次以上故障中恢复过来。让网络环境的某个机架出现故障时,让我也能够及时恢复。同时,必须具有灵活性。让我可以根据业务部门的需求来保护系统。如果他们愿意投入更多资金,我可以为他们提供更大的可用性。如果数据不太重要,我可以减少这些数据的可用性。”归根到底,由于横向扩展NAS存储基础设施是建立在商业硬件之上,那么硬件可能会出现故障,系统应该被设计为能够处理较高频率的硬件故障。

企业保障 Kirsch表示,“由于这项技术已经成熟,它应该是IT的关键部分,这个系统应该具有快照、复制等所有其他传统IT功能。这项技术是从HPC root逐渐发展出来的,但是如果你打算建立一个横向扩展系统,你必须以适应企业环境的方式来建立。”(邹铮编译)

(责任编辑:蒙遗善)

时间: 2024-10-27 02:49:46

横向扩展NAS迎战大数据的5大原则的相关文章

纵向扩展与横向扩展NAS优劣因素综合分析

[天极网办公频道11月28日消息]谈到系统的可伸缩性,Scale-up(纵向扩展)和Scale-out(横向扩展)是两个常见的术语,对于初学者来说,很容易搞迷糊这两个概念. Scale Out(横向扩展):从字面意思来看,Scale Out是使用靠增加处理器来提升运算能力和增加独立服务器来增加运算能力.就是指企业可以根据需求增加不同的服务器和存储应用,依靠多部服务器.存储协同运算,借负载平衡及容错等功能来提高运算能力及可靠度. Scale Up(纵向扩展):指企业后端大型服务器以增加处理器等运算

混合云部署中横向扩展NAS起关键作用

目前,世界上大多数的数据中心仍然使用垂直缩放的存储解决方案,这是一个困扰人们的问题.这种传统的存储方法在设计时并没有考虑到现在达到泽字节的庞大数据.企业以往任何时候需要存储更多的指数的数据,他们需要采用不损害性能的经济实惠的方式来进行.软件定义存储的出现使得横向扩展存储解决方案成为了现实. 如今出现的另一个相对较新的技术混合云,使组织折云架构具有最大的业务灵活性,这有助于在达到预算和性能目标的同时,最大限度地提高效率.简而言之,混合云是一个使用混合的内部部署,私有云和公共云服务的组合,以及业务流

HGST企业级硬盘为您的大数据创造更大价值

近日,"第六届中国云计算大会"在北京国家会议中心隆重举行.本届大会以国际化视野,帮助与会者了解全球云计算技术的发展趋势,是国内规模最大.规格最高.参会者人数最多的IT盛宴.HGST(昱科环球存储科技有限公司,原日立环球存储科技有限公司)作为全球企业级云计算应用首选的存储解决方案提供商,携最完善的存储解决方案参加了此次盛会,跟与会者分享了互联网搜索.社交媒体.在线零焦点.银行机构等各行业领军企业依靠HGST确定其公共云.私有云及混合云的分层.存储池构建.部署及安全各项事宜的最佳状态,从而

数据成为甲方 大数据呼来大服务时代

本文讲的是数据成为甲方 大数据呼来大服务时代,近期,中国电子信息产业发展研究院(CCID)日前发布<2011年中国数据库软件市场研究报告>(以下简称<报告>).预测2012年中国数据库软件市场规模预计达到38.71亿元,将比2011年大幅增长20.6%,以人大金仓为首的国产数据库软件市场规模预计达到3.29亿元,比2011年增长26.5%,呈现爆炸式增长.报告指出预计到2020年,世界上的数据存储总额将达到35 ZB,大数据的应用将成未来数据库的必然趋势.同时报告认为,国产数据库要

解读2015之大数据篇:大数据的黄金时代

2015年,整个IT技术领域发生了许多深刻而又复杂的变化,InfoQ策划了"解读2015"年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行. 本文是大数据解读篇,在这篇文章里我们将回顾2015展望2016,看看过去的一年里广受关注的技术有哪些进展,了解下数据科学家这个职业的火热.在关键技术进展部分我们在大数据生态圈众多技术中选取了Hadoop.Spark.Elasticsearch和Apache Kylin四个点,分别请了四位专家:Hulu

将大数据转化为大价值实用战略

当今,一些最成功的公司通过捕捉.分析和利用大量各式各样.快速移动的"大数据"获得了强大的业务优势.本文介绍了三种使用模型,可帮助您实施灵活.高效的大数据基础设施,以获得自身业务的竞争优势.本文还描述了英特尔在芯片.系统和软件领域的多项创新,可帮助您以最佳的性能.成本和能效来部署这些和其他大数据解决方案. 大数据机遇 人们常将大数据比作海啸.当前,全球五十亿手机用户和近十亿的 Facebook* 与 Skype*用户正在生成规模空前的数据,而这些用户只占全球网民人数的一小部分.英特尔估计

2013年展望:大数据发展十大趋势分析

本文讲的是2013年展望:大数据发展十大趋势分析,2012年大数据发展如火如荼,大有赶超云计算之势.如果把今年比作大数据落地生根的一年,那么2013年将迎来其茁壮成长,甚至开花结果的一年.有预测称,大数据市场将以每年40%的速度增长,2012年大数据市场规模约为50亿美元,2013年将翻倍.2013年大数据发展有哪些新趋势呢?不管是IDC.Gartner还是国内大数据研究机构都给出了各自的答案,笔者在这里总结一下各方观点,并谈谈自己的想法. 预测1:开源大数据商业化 随着闭源软件在数据分析领域的

SAP Sybase全球CTO:大数据是个大谎言

本文讲的是SAP Sybase全球CTO:大数据是个大谎言,美国福布斯杂志最近发表了一篇Irfan Khan的署名文章,"The Big Lie About Big Data",Irfan是SAP Sybase公司全球CTO,负责SAP公司全球的数据库战略方向. ▲SAP Sybase公司全球CTO   Irfan Khan 题目很吸引人,甚至可以说有些"耸人听闻",但是读下来,其中有很多观点倒是和我前一段在"通讯行业云计算峰会"上发表的一些言论

大数据系列之大数据分析如何权衡存储

文章讲的是大数据系列之大数据分析如何权衡存储, 系列1:未来24个月市场趋势和IT投入重点 系列2:大数据分析对IT资源的需求 在之前的系列1和2中,我们已就大数据分析的发展趋势以及对IT资源的需求进行了解析.接下来,针对大数据分析的重要一环-存储,中桥将结合市场热门的存储技术如闪存.固态盘等,来从存储性能.数据保护等角度进行分析. 通过前文的相关数据分析,我们已经了解到,随着大数据时代应用数量.应用数据量和使用者数量的增长,系统对存储IOPS以及OLTP和OLAP的要求越来越高.传统存储也越来