业界对云计算的定义多种多样,不过,从公认的几种云计算模型看,存储是无论如何也绕不开的基础支撑组件,云存储作为云计算服务的分支之一,更是把存储提到了首要的位置。与此同时,能够在底层架构中很好的解决存储问题的供应商恐怕并不多,要实现云计算,存储还面临诸多瓶颈。
在一次Intel组织的媒体训练营上,Intel(中国)有限公司服务器平台产品经理张振宇就曾表示:“今天谈云计算以及云架构中的虚拟化,存储是非常困难的问题。”
解决非结构化数据增长难题
在Intel规划的云存储系统中,把用户实际的存储需求分成了两种类型,也就是我们所谓的结构化数据与非结构化数据。
结构化数据一般都存储在数据库中,通常又被叫做数据库数据,通常企业的关键业务应用,如Oracle、SAP等应用中往往基于这种类型的数据。这类型数据可以用数据库的二维表结构逻辑来表达与实现,每一次读取的数据块往往并不大,一般为4K或者8K,但是读写往往会非常频繁,由于每次读写都会带来硬盘磁头换道寻址的读写延时,因此传统的存储系统往往采用了大规模并发、以及大量的读写优化来保障结构化数据的存取需求。
此外,担当企业关键业务应用的数据存储基石,数据安全性一定要保障,也因此,为结构化数据存储而设计的存储系统也往往采用大量的数据安全保护措施,保障企业关键业务运营数据安全。
衡量数据库读写性能的IOPS性能指标一度成为企业存储系统设计所追求的极致,然而随着云计算日益走向普及应用,社交网络兴起,到如今移动互联网与物联网蓬勃发展,用户突然发现,过去的结构化的数据在向非结构化与半结构化发展,大数据成为对传统IT系统的另一个挑战。
上图为IDC发布的2010年至2014年间数据增长趋势预测,其中,最底下的黄色数据块代表传统企业数据库所产生的结构化数据增长量,年增长率仅为23.6%;黄色数据之上的红色数据,代表企业系统中的备份以及数据仓库等产生的备份数据,从图中可看到,其增长趋势并不明显,年增长率为24.2%;红色数据之上的灰色数据块代表归档等非结构化数据的增长趋势,在图中可看到明显的上升,年增长率达到了54.8%;最上面的绿色部分增长最快,这部分数据的年增长率甚至达到了75.6%,这部分数据来自于内容仓库,具体包括了Web、电子邮件、社交网络、文档共享等应用产生的各种各样的文件数据。