在前不久的一次采访中,某保险公司用户指出,对于由小文件组成的大容量文件系统的备份,如果备份速度能够达到80GB/小时,就已经相当不错了。为此,我查阅了一下资料,以HP磁带库为例,最大已经可以达到38TB/小时的水平。该保险公司也是采用LTO3磁带机的带库,为什么在备份速度上会有这么大差距呢?
为此,我请教了业内有关的专家。专家指出,数据备份的速度并不完全取决于磁带库或者磁带机的速度,同时还与备份软件的备份方法有关。他指出,备份软件在对数据进行备份时,第一个动作就是要对需要备份的数据进行扫描,以该保险的数据为例,有上百万个小文件,如果备份软件需要对这些小文件在磁盘上位置一一加以了解,然后再通过网络拷贝到备份服务器,这是一个相当费时的操作,其中,文件服务器、网络、备份服务器的性能都有可能成为速度的瓶颈。对此,一些备份软件采用了“卷拷贝”的方式,对需要备份数据的整个卷进行拷贝,例如对一个20GB的C盘进行拷贝,不管这些小文件在C盘上是怎么存储的,统统拷贝到备份服务器。其中,都是“卷拷贝”也还有些细微的差别。有些备份软件的“卷拷贝”,不管实际数据占用了多大的空间,对整个卷统统进行拷贝。但是优秀的备份软件,如CommVault Simpana则只是针对实际数据进行“卷拷贝”。
“卷拷贝”的过程,就是数据的读取过程。这些数据被读取到备份服务器之后,备份软件在将其拷贝到磁带库或者磁带机。专家指出,备份数据的恢复速度至关重要,毕竟备份的目的不是单纯的备份,备份的速度是为了恢复,如果恢复速度太慢,那么效率就大打折扣了。他指出,恢复速度的快慢,其核心在于备份软件向磁带拷贝的数据的方式。以卷拷贝为例,如果备份软件只是囫囵吞枣式的将“卷拷贝”数据拷贝到磁带,那么,恢复就必须全部数据。优秀的备份软件,能够做到单一小文件,也就是细颗粒度的文件恢复,它不用恢复全部数据,能够做到直接恢复目标文件。因此,不同的备份软件对备份速度影响非常大,更为关键的是恢复速度有非常大的区分,对此,用户应该认真地分析和比较。