*******技术宅男********

磁盘阵列与虚拟带库的备份性能分析

 利用磁盘进行备份的优劣表现(D2D)

  有些用户的咨询专家开始倾向使用磁盘阵列作为备份设备。随着SATA技术的兴起,大容量磁盘的价格进一步下降,性能价格比更好,使很多人开始关注这种做法。利用磁盘作为备份设备的解决方案应运而生,这个解决方案目前有几种流行的实现方式:

  1、最初大家的普遍做法,也就是采用标准的光纤通道或者SCSI磁盘阵列,安装容量大价格低的SATA硬盘,直接连接到备份服务器上,利用服务器把磁盘阵列格式化成一个文件系统;

  2、随着NAS技术的兴起,也有的用户利用NAS上的存储空间进行备份;

  3、目前一些备份软件所具备的磁盘备份功能。

  这一类解决方案的特点是:利用磁盘作为存储设备,磁盘被格式化成文件系统。这种方式相对于磁带库来说解决了很多问题:

  不再受磁带库设备和介质可靠性方面的困扰;

  规避了磁带加载卸载对备份性能的影响,其持续读写性能达到或超过了中端磁带库;

  提高了设备空间利用率;

  磁盘阵列设备在用户环境中很常见,一般的系统管理员不需要过多的专业知识都可以自行维护,降低了维护成本。

  而且,通常看起来投资比较低,用户只需要购买一台磁盘阵列就可以了。

  然而,在实际应用中,用户逐渐发现,这种最简单的基于磁盘阵列的解决方案并不是完美的。

  让用户头疼的问题

  1、共享

  如果在一个有多台服务器的环境中要实现LAN-FREE备份,配置的复杂性和成本都会迅速提高。

  一般来说,实现备份到磁盘,都要在这台磁盘阵列上建立一个文件系统,才能够被备份软件识别。而一般的文件系统都不能被多服务器共享,只有磁带库可以实现共享。

  这就是说,如果想像使用传统磁带库一样,通过SAN实现多服务器共同使用一个磁盘阵列,必须要在磁盘阵列上建立多个逻辑设备,然后将每个逻辑设备分配给每抬服务器。

  这就带来了管理上的一系列问题:

  1) 如何决定为每台服务器分配多少块磁盘?

  2) 一旦分配的空间太少,如何进行在先扩展?

  3) 一旦分配的空间太多,如何缩减?

  4) 这一功能是否需要昂贵的卷管理软件工具来实现?

 2、安全性

  这种简单的基于磁盘阵列的存储设备是以文件系统的方式出现的服务器上的,这个文件系统可以由任意工具来操作,也可以被任何人访问。一个有意无意的”DEL”就可以毁掉所有备份数据。总之,和文件系统上的其他文件一样脆弱,这意味着很多危险:

  1) 会不会由系统管理员的误操作或者其他人的恶意删除导致数据丢失?

  2) 会不会被人将数据非法拷贝走,到其他计算机上恢复,导致关键机密的泄露?

  3) 会不会被病毒感染,导致备份数据无法恢复?

  3、性能

  首先,文件系统本身就可能是性能瓶颈,尤其在多任务、多进程的时候,文件系统很有可能成为整个备份系统的瓶颈。

  文件系统难以解决磁盘碎片的问题,磁盘碎片会导致文件系统的性能逐渐下降,而且,当数据量比较大的时候,磁盘碎片的问题很难以解决。

  4、功能

  备份管理软件是设计为磁带库使用的,虽然目前绝大部分备份软件都支持使用文件系统作为备份设备,但与使用磁带时的功能有一些差别。这些差别会导致一些严重的问题:

  1) 一些主流的备份软件在备份数据超过保存期限时,如果使用磁带介质,可以方便的进行介质回收。而如果使用文件系统,则无法自动回收这部分磁盘空间。系统管理员必须手动的用操作系统命令删除相应的文件。但这一工作是高风险的,因为文件系统是不能区分文件是否超出的了保存期限;

  2) 当备份系统因为某种原因丢失了介质索引的时候,一般都可以利用重新扫描磁带重建索引。但如果采用磁盘作为备份设备,备份系统无法对其进行扫描。这样,很有可能所有的数据仍然在存放在磁盘阵列上,但却无法恢复。

  3) 放在磁盘阵列上的备份数据,无法进行介质复制,将备份数据拷贝到磁带上,进行离线保存。这样,就失去了磁带因此带来的灵活性,如:离线保存、数据移植、异地容灾等。

  根据以上的分析,这种简单的利用磁盘阵列直接当备份设备的做法,虽然解决了来自磁带库的问题,但也产生了磁带库设备没有的新问题,而且难以解决。因为,到目前为止,很少有人采用这种办法进行备份。

 利用虚拟带库进行备份的优劣表现——VTL突破D2D

  D2D方案包括文件复制、数据镜像、快照等形式。文件复制或镜像不仅使备份数据持续暴露在病毒、人为误删等在线威胁之下,同时也只保留在线数据的最终状态,数据灾难发生后无法恢复历史数据。在较为成熟的快照技术中,镜像式快照消耗容量过大,指针式快照虽然支持类似常规备份的增量快照,但必须捆绑专用软件系统,总体拥有成本过高。

  D2D解决方案存在最大的问题,是与文件系统相关的缺陷。结合外接RAID阵列的备份/恢复软件的D2D性能依赖类似NTFS和NFS的文件系统,它们是为了在PC服务器系统中使用而生成的。这些文件系统用来为多个用户管理多个小型文件,在磁带备份应用软件执行较大的写操作时,会发生性能冲突。

  大多数D2D RAID阵列使用的通用文件系统对于磁带备份并非是最优化的。与备份系统相关的通用文件系统还存在的另外三个问题:大多数通用文件系统同典型的服务器一样,随着时间变化产生大量文件系统碎片;类似FAT、NFS和NTFS的通用文件系统受到文件系统、分区和单个文件大小的限制;大多数D2D文件系统存在安全性隐患。

  VTL在备份过程中超越D2D系统的原因之一是,备份应用软件将备份写到VTL磁盘,这类似以数据流形式写到磁带。另一方面,D2D写单独的文件,在对下一个文件操作前,必须记录每个文件的位置和文件系统的元数据。VTL以数据流形式写而不是以单独的文件形式写,这一方法能够避免受到文件系统所支持的最大文件数目的限制。VTL文件系统的专有特性克服了D2D的通用文件系统遇到的限制问题。

  在安全性方面,访问VTL的文件系统和访问磁带类似,用户不能直接访问磁带,被病毒感染的文件也不会感染磁带。

  VTL可以提供综合/集中全量备份的好处,在知道了所有文件的位置和发送的时间后,就可以简单地使用指针来建立新的全量备份。使用指针可以建立一个新的虚拟全量备份,来取代从一个虚拟磁带向另一个虚拟磁带拷贝数据。当新的全量备份建立后,可以告诉备份软件全量备份的内容和全量备份所在的”磁带”,然后备份软件会把该全量备份看做和其他全量备份一样。该全量备份还可以用于进一步的增量备份和恢复,并且能拷贝到真正的磁带。

  虚拟全量备份除了即时功能以外,在容量方面也具备优势。如果使用备份软件建立了真正的综合全量备份,与通常的全量备份一样,也会占用同样大小的磁盘空间。然而VTL的虚拟全量备份几乎不会占用任何磁盘空间,因为VTL仅仅使用了指针。

Posted in linux技术

Comments are currently closed.