之前我们已经介绍过主存储重复数据删除技术的益处,以及主要供应商产品对比。但是任何技术都是双刃剑,用户在实施之前还是应该综合考虑,周密部署,取其长避其短。本文主要介绍了主存储数据精 简的几个缺点。
本文作者是Wikibon分析师论坛的联合创始人兼高级存储分析师David Vellante.
曾有一场关于存储优化及更好地利用存储容量的经典讨论。根据Wikibon用户反馈信息,我们看到众多存储供应商已成功营销了其离线/备份软件的重复数据删除技术(这一技术可将备份数据量显著减少,减少比率为5-15:1)。
主流在线存储精简技术
用于备份的重复数据删除技术(de-duplication)与通过算法来实际更改数据量的压缩技术(采用算法创建一个计算副产品,并写入少量字节)不同。有了重复数据删除技术,数据未发生变化,而是约2-N 倍的复本数据被删除,指示器被插入数据的一个“主实例”。单实例即可被视作重复数据删除。
传统的重复数据删除技术通常不适合在线软件或主存储软件,因为进行重复数据删除所需的算法不可避免的会加长响应时间,这样就导致了费用增加。举例说明,流行的重复数据删除方案比如那些来自 Data Domain、ProtecTier (Diligent/IBM)、Falconstor和EMC/Avamar的解决方案并未被用于减少在 线存储器的容量。
有三种主要方式实现在线存储器优化、减少容量需求并提高整个存储效率。尽管业内通常使用如重复 数据删除(例如针对NetApp A-SIS)和单实例这样的术语,通常,Wikibon所提到的在线数据压缩或主存 储压缩是从一个较宽泛的角度来说的。这些数据删除技术指的是如下类型的解决方案:
NetApp A-SIS和EMC Celerra或采用“data de-duplication light”或采用嵌入存储阵列的单实例技术;
主机管理的离线数据精简方案,例如Ocarina Networks;
来自Storwize的在线数据压缩设备;
与某些备份数据精简方案不同,这三种方式采用无损数据压缩算法,这意味着从数理角度看,可经常 进行字节重组。
这几种方法都有自身的优点和缺点。最显著的优点是降低了存储成本。然而,每种解决方案都在网络 上增加了新的技术层级,导致系统的复杂性和风险增大。
1.基于阵列的数据精简技术
基于阵列的数据精简技术,例如,在数据被写入时,A-SIS在线运行,减少主存储容量。WAFL (NetApp的任意位置写入文件布局技术)的重复数据删除功能可实现写入时对4K数据块复本的识别(创 建4K数据块的32-bit弱数字信号,接着一个字节一个字节地进行对比以保证不出现hash冲突),并将其 放进元数据的一个签名文件。这一复本识别任务与快照技术相似;在控制器资源充足的情况下,是在后 台进行的。其默认每24小时进行一次,每次更改的数据量可达20%.
A-SIS解决方案有三个主要缺点,包括:
采用A-SIS,重复数据删除技术仅能在单一flex-volume(而不是传统数据卷宗)内实施,这意味着候 选数据块必须是位于同一数据卷宗中的可对比数据块。重复数据删除是基于数据量为4K的固定数据块, 而非IBM/Diligent任意数据量的数据块均可实施这一技术。这就限制了重复数据删除技术的潜力。
当把A-SIS和其他多种依赖软件的快照技术一起采用时,限制较多。快照在重复数据删除之前进行,在这种情况下,重复数据删除的候选数据块就被限定,以保持数据的完整性。这就制约了空间节约的潜 力。尤其是,NetApp的重复数据删除技术无法实现空间有效的快照。
上述重复数据删除的运行费用意味着A-SIS将不再是高利用率(可实现利益最大化)的控制器。这使 得进行元数据精简的费用增加了近6%.
为充分利用功能优势,用户被锁定采用NetApp存储器。
IT经理应该注意到A-SIS是ONTAP(公司存储操作系统)的NetApp Nearline组件不收费标准。