如果把20名数据中心管理者放在一起并询问他们最佳的数据存储方法是哪种,你恐怕会得到至少45种答案。
伴随着戴尔完成对EMC的收购计划,长久以来停滞的存储技术正迅速发展着。从开源存储到专有存储,从iSCSI区块存储到Ceph,以及从固态存储到基于云端的存储服务,可选内容众多。想要走出这个迷宫,数据中心必须制定自己的路线图。
磁盘正在消亡
缓慢的磁盘存储正在被以SSD为主的企业级存储方法全面取代。据称SSD的成本很高,但不少这样的比较目的仅仅在于制造恐惧、不确定和疑问。在服务器领域,SSD的成本确实要比10,000 RPM转速的HDD磁盘来的低。
HDD磁盘唯一比SSD成本低的领域就是在低端的3.5英寸驱动器上。即使是这些散装的3.5英寸驱动器也正面临着SSD在尺寸方面给予的压力。目前SSD在价格方面还是会高些,但相信这一劣势会在2016和2017年就消失殆尽。
SSD以及适应大型数据中心的全闪存阵列,才是值得你进行存储投资的地方。SSD的性能从根本上改变了数据中心的动态性能。以SSD作为主要存储,数据中心运营部门可以进一步压缩作为次要存储的散装低成本硬盘驱动器的数量。
再加上主要存储和次要存储按照闪存和SSD各自速度进行的再平衡,我们将在主存储中看到更少的TB级存储。归功于数据压缩技术,按照当前的估算容量,数据中心未来将只需要当前次要存储总容量的20%即可满足应用。
这样的好处就是不再需要大量的人力维护,而且一些大型的投资也可以节省下来,却同时带来更好的性能。
备份和主云存储
基于云端的存储在很多人看来是备份和归档的一种选择。这很说得通,云端可以为实现灾难备份而自动创建离线备份。但并不是所有的备份都一模一样,Google的Nearline就是一种基于磁盘的,据说是采取每小时通过Amazon的Glacier节拍访问时间数据的备份工具。
抛开备份和归档不谈,基于云的存储总是个充满争议话题。总有人在讨论公有云上的IT工作信息问题,公司持续不断地提交重要的IT工作信息到公有云,而为这些工作信息所准备的主要存储也同样处在迁移之中。在室内数据中心硬件和公有云之间传送数据是相当缓慢和昂贵的,这也成为阻碍混合云方法普及的障碍。
基于混合云工作信息的数据存储方法所遇到的问题不会在短期内解决。除非谷歌开始在自己的工具中提供光纤,否则电话公司该开始编造光纤没有用的借口了。
存储架构
我们存储数据的方式也在经历着变化。区块存储的概念已经束缚我们太久,相关的应用程序都是基于这种方式编制,很难放弃这种方式。其实文件存储的方式也一样够快,真正的问题在于我们能否用对象存储的方式取代现有方式?
存储及计算供应商Data Direct Networks已经通过演示证明对象存储可以做的很快,但这种方式主要面向存储例如数据库这样实时都在咀嚼数据的整个对象而非文件。这使得对象存储在需要经常性改写数据的应用程序上并不那么有用。
对象存储软件已经在上述问题上有所突破。现在已经有办法像支持区块存储那样在对象存储中支持对象了。此种数据存储方法对多个不同的对象存储系统都奏效,这其中就包括很普及的Ceph开源存储。随着大数据和面向对象的存储模式成为主导,就是这样的非主流存储方法将会成为日后IT组织的通用标准。
如果上述的一切对于IT专业人士来说还不够刺激,那么软件定义存储(SDS),正处在概念宣贯和技术转移阶段的一种技术,是运行在虚拟机上旨在重新设计数据服务在多数电器上运行方式的技术,其数据则是存储在第三方更加廉价的硬件上。
尽管在成为主流之前尚需时日,SDS未来的意义将远不止存储资源管理。即使如此,其在当下也极具冲击性,促使EMC将存储业务卖给戴尔。
购买什么
看样子以太网将成为连接存储的赢家,因此仅在iSCSI和对象存储盒(object store boxes)领域投资是明智的选择。尽管部分工业部门人士并不同意,但光纤通道的概念已然过时了。
少买些10,000RPM的存储媒体吧,因为SSD可以轻易取代它。数据中心的管理人员应该考虑一种混合的数据存储方法。在SSD/Flash前端存储方面投资,将全闪存存储或相关设备的数据压缩后转移到你的HDD设备转换为散装的次要存储。这样可从存储预算中节省相当一部分成本。
相比于传统存储供应商,为谷歌和AWS数据中心提供大容量存储的供应商,将依靠低成本的阵列和对象存储产品进入企业端市场和渠道。我们已经看到联想授权IBM存储以及Supermicro提供(对象存储)盒子的服务,Quanta和其他厂商也不会甘落人后。企业用户可以为谷歌的散装价格驱动器多支付一点费用,就可以和EMC那些单价超过1000美元的驱动器说再见。
当下对于数据中心管理者是采买的好时机,数据中心能够以更低的价格得到更好的产品。未来工业将奔向何方需要花点心思和知识来考虑,但由此带来的结余和收益却是值得的。
本文转自d1net(转载)