采用重复数据删除
您的IT系统电费支出是不是越来越大?您是否在为如何降低功耗、节约能源煞费苦心?近期,IT168服务器频道和存储频道将推出“">企业IT节能系列文章”专题策划,我们将从芯片、组件、系统、软件乃至数据中心等多个层面、多个角度出发,陆续整理出一系列实用的IT节能妙招,相信总有一招适合你!
对于整个数据中心而言,需要我们关注的不仅仅涉及到服务器层面的节能问题,存储中心也同样涉及到节能、环保、降低存储成本以及实现绿色存储的举措。而本期我们将给大家介绍的重复数据删除技术能够有效的减少数据存储容量,从而实现数据中心节能,降低散热需,实现“绿色”意义。
由于磁盘技术近年来的快速发展,一些企业和用户越来越倾向于采用磁盘进行备份或者归档,由此带来的能耗问题也是突出的。传统的备份策略往往会在用户的磁盘空间里面产生大量的冗余数据,由此消耗了大量不必要的磁盘空间,带来一系列的能耗和冷却的问题。有什么办法能够消除掉这些多余的数据,从而避免不必要的能源消耗呢?
重复数据删除的节能意义
重复数据删除最大的优势在于节约用户数据存储所需要的存储空间,因而能够节约数据存储所需要的能源损耗。基于磁盘的备份归档方案与传统磁带库相比在性能、稳定性方面都有很多优势,但是一个突出的不足之处就是,磁盘介质是在线存储,需要一定的能耗,而磁带则是离线存储,本身不需要耗能。
重复数据删除能够大大减少数据存储与备份所需要的空间,因而减少存储与备份的能耗。大家知道厂商宣称的重复数据删除比根据不同的数据能够达到1:30或者1:20,无论对存储空间的节约方面和能耗节省方面都是有着突出意义的。
一般人往往容易混淆重复数据删除与数据压缩的概念,二者看起来的确有一些相似之处。但实际上,数据压缩技术通过对数据重新编码来降低其冗余度(redundancy);而重复数据删除技术则着眼于删除重复出现的数据块。前者属于文件级别,后者根据不同厂商的技术特点,既可以是文件级别的,也可以是数据块级别的。
应用重复数据删除需要注意什么
重复数据删除的产品最早在2005年推出,到了2006年底和2007年初几乎所有的备份系统上都开始广泛引用,现在已经成为备份产品的必备选项之一。那么用户在选择重复数据删除的产品时需要注意哪些因素呢?
一些业内专家提出了如下几条原则:
1. 重复数据删除技术在具体的备份应用中,不应该对备份性能有任何影响。由于重复数据删除不同的实现模式,一些重复数据删除的实现方式本身需要耗用大量的CPU资源,在整个备份进程中增加大量的处理进程,这样尽管用户获得了一定比率的重复删除比率,但在客观上降低了备份性能。实际上,采用基于磁盘的备份方案相比磁带库的突出优势就体现在降低备份窗口获得高性能备份与恢复,而如果采用的重复数据删除技术不合理,则有可能因为获得数据压缩比率而损失掉一定的备份性能。
2. 高端一些的用户需要注意,当采用重复数据删除等等一些VTL增值技术之后,还需要考虑与未来技术发展方向的兼容问题。例如,我们需要用VTL技术来建立一个灾备体系,需要使用异地复制技术,那么如果我们前期在使用重复数据删除技术的时候没有考虑未来需求的变化,则会制约系统的发展。
3. 此外还有面向磁带库的出库技术,尽管在数据量小的时候我们可以不考虑采用磁带作为离线介质,但是用户的数据量始终在增长,未来如果有这样的需求,则需要在构建系统的开始考虑到未来需求的发展。
总结一下,以上的观点,对于备份性能的影响是第一位的,也就是说在使用重复数据删除技术获得压缩比的同时不能以牺牲备份性能为代价,其次,用户在使用重复数据删除的同时必须考虑未来技术发展方向的问题,必须与未来的需求以及发展相兼容。
自动精简配置技术
您的IT系统电费支出是不是越来越大?您是否在为如何降低功耗、节约能源煞费苦心?近期,IT168服务器频道和存储频道将推出“企业IT节能系列文章”专题策划,我们将从芯片、组件、系统、软件乃至数据中心等多个层面、多个角度出发,陆续整理出一系列实用的IT节能妙招,相信总有一招适合你!
除了重复数据删除、数据压缩等等的技术能够通过减少数据容量减少磁盘数量,从而进一步减少能耗,存储领域还有一些其他的新兴技术,尽管并不能够减少数据量,但是也同样能够减少系统所需要配备的磁盘数量,起到节省能耗的作用。自动精简配置就是其中之一。
自动精简配置是从去年开始进入我们视野的,简单来说,自动精简配置就是一种容量分配计划的优化技术。在传统的存储系统中,当服务器端的某项应用需要一部分存储空间的时候,往往是预先从后端存储系统中划分出一部分足够大的空间预先分配给该项应用,即使这项应用暂时不需要使用这么大的存储空间,这部分存储空间也已经被预留了出来,无法给其他的应用提供存储空间。这就在系统中造成了无法利用的存储空间,不仅仅浪费了大量的采购成本,还产生了不必要的能耗。
采用自动精简配置的系统则不会一次性的划分过大的空间给某项应用,而是根据该项应用实际所需要的容量,多次的少量的分配给应用程序,具体的分配方式每个厂商有不同的特点,但是都保证了每个应用程序不会一次性的占用过多的存储空间。当该项应用程序所产生的数据增长,分配的容量空间已不够的时候,系统会再次从后端存储池中补充分配一部分存储空间。
自动精简配置听起来很简单,但是我们却不能小看这种容量分配方式的改进。原因在于,在自动精简配置出现以前,我们往往习惯于预测过多的容量空间分配给应用程序,这样每个应用程序都占用了过多的存储空间,导致整个存储系统的容量利用率变得非常低,很快我们就需要采购新的存储空间,而我们在采购的时候也同样习惯于预先采购大量的多余的存储空间以作备用,这种应用模式带来采购成本上、能源上很多不必要的浪费,也增加了管理的复杂程度。
另外,一些厂商的自动精简配置的实现方式是通过虚拟化从存储资源池分配存储资源到逻辑卷,所以比传统方法,往往可能有更多的物理磁盘来支持每个逻辑卷。这将减少输入输出列队次数,而且也将减少某一个“热点”在同一块磁盘发生过多次的可能性,多块磁盘替代一块磁盘完成了以往的任务,性能比传统方法也有显著的提升。
在“绿色存储”蔚为潮流的今天,自动精简配置也受到了越来越多的追捧。数据中心的能耗问题直接与磁盘相关,而自动精简配置能够帮助用户在不降低性能的情况下,减少磁盘购买数量,从而降低系统的整体能耗、冷却成本、以及二氧化碳排放量,因而也具有不可忽视的绿色意义。如今,自动精简配置已经成为“绿色存储”概念下的一个重要的关键词。
目前各个厂商的存储精简技术都可以减少存储磁盘的容量需求,容量大约有60%的缩减。也就是说,60%的能源和二氧化碳排放能够通过自动精简配置技术被裁掉。因为用户对于未来磁盘的需求数量降低了很多,而全球磁盘价格自然也是不断走低,这样当然也就大幅削减了资本开销。而且由于磁盘空间的减少,相应的电力成本、制冷成本、空间成本都相应缩减。
总的来说,使用自动精简配置后的磁盘需求削减,确实很大程度上缩减了TCO。减少的TCO意味着延迟未来的添加磁盘的需求。但如同虚拟化、重复数据删除等等新兴的技术一样,任何一项技术从诞生到逐步完善再到在应用中普及都还需要一定的过程,就这项技术而言,目前成功的应用案例尚不十分普遍,用户在决定部署时多少需要担一些“第一个吃螃蟹”的风险。但毫无疑问,自动精简配置是存储未来的发展方向,并且逐步成为存储系统的必备的主流配置。
相关阅读:
企业IT节能之配件篇
企业IT节能之芯片篇
企业IT节能之机房篇