随着工业革命的发生,科技的日新月异,人们选用的存储介质也发生了较大的变化,硬盘开始成为人们日常生活工作中的必备品,并在数据存储中扮演着重要角色。但是近年来,由于社交网站、智能移动终端的不断普及,人们创造出来的数据量是惊人的,据统计2013年光中国产生的数据总量就已经超过0.8zb(相当于8亿tb),在海量数据的压力下,数据的存储介质会发生什么改变?企业面对海量数据如何改造升级传统数据中心来满足业务运营的需求?新兴的互联网巨头公司又该如何解决自身庞大数据的存取难题?这些亟待解决的问题是用传统手段,比如无限制扩展数据中心规模,扩充存储容量,还是采用新的科技手段,选择新的存储介质来满足海量数据的存取需求呢?
大数据下的数据取舍
要想解决上面提到的问题,首先我们应该先了解现阶段下海量数据的构成特点。以前的数据存储基本是基于结构化数据进行的,这些数据有一定的规律性,通过简单的机制就可以方便的存储数据并能够随时获取到相关信息。但是随着社交网络以及智能设备的普及,任何一个人都能产生大量数据,而这些数据又杂乱无章,毫无规律可循,这些数据又被被称为非结构化数据。尤其是互联网行业,用户在其平台上所创造的视频、文字、图片更是缺少一定的信息标注,使得早期的数据中心很难区分数据类型,对数据信息采取直接存储的方式,极大降低了数据的可用性,并造成了一定的成本浪费。
在大数据时代,人们开始重新审视数据的可用性以及重要性。由结构化数据和非结构化数据组成的海量数据对于企业的it建设成本负担占据多大比例?这些数据的可用性对于企业来说是否能够逐渐降低其投入产出比?如果要解决这些问题,首先要从存储其数据的介质开始说起。
传统机械硬盘存储的弊端
我们知道自从硬盘被ibm这蓝色巨人造出来后就一直承担着数据存储的重担,在企业it基础架构中,硬盘都是搭建it整体架构的“板砖”。硬盘厂商通过技术更迭、厂商之间的各种收购,现在已经形成了寡头时代,如买了ibm硬盘业务的日立环球存储被西部数据收购,更名hgst,西部数据也因此坐拥硬盘老大地位;由ibm前员工创办的希捷公司,在收购迈拓、三星的硬盘业务后,也稳居硬盘市场第二,硬盘市场竞争激烈程度可见一斑。因为用户的高需求量,才能创造市场的繁荣,份额大了,抢得人就会多,手段就会激烈。
那么这一对硬盘的高需求量在大数据、云计算时代下发生着哪些变化呢?因为传统机械硬盘单碟容量的限制,导致大多数用户在面对海量数据时只能采取不断扩容的手段来满足数据存取的需求。而不断的扩容必然导致设备能耗的增加以及空间资源的浪费,这也使企业陷入了一个“容量无底洞,金钱塞不够”的状况。另外,因为传统机械硬盘的转速、性能方面以及高可靠性等方面的局限,令用户在存取大容量数据时,增加一定的时间成本。再加上现在占据主流的非结构化数据的多样性,让用户不再单单满足于简单的数据存储,而是需要在成千上万次的数据存取过程中去寻找数据价值,这对于一块硬盘的性能有非常高的要求。
闪存的选择
传统机械硬盘无法满足用户的各种新需求,技术的发展又不能很快的跟随着用户需求的变化速度,那么大家就开始寻找其他类型的存储介质,闪存就被提了出来。顾名思义,闪存就是存取速度方面非常占优的存储介质。闪存的出现有一定时间了,但是人们总是对它报以不信任感,除了价格昂贵,还有传统的认知,小小芯片的存储介质实在难以让传统企业信任,还是大大的碟片看着让人舒服省心啊。到目前为止,很多金融机构仍然不敢将闪存作为高性能运算方面的主要存储介质,也是出于对其不稳定性的担忧。
但是在性能方面,闪存绝对可以解决现在大数据时代下的各种需求。对海量数据的存取速度,已经超过传统机械硬盘的几十倍,小而精的体积又让传统数据中心节约大量空间,并能够节省能耗,为数据中心省下一大笔钱。当然了,“节省一大笔钱”的前提是这些闪存都是别人送你的。所以,现在闪存的应用还是走不出贵与不稳定的“高富帅”形象。两大硬盘巨头到现在也没怎么发展固态硬盘业务,可能也是说明了市场选择的一个大致方向。