1. 虚拟磁带库简介
虚拟磁带库(Virtual Tape Library, VTL)就是将磁盘存储介质仿真为物理磁带库的备份解决方案产品,广泛应用于数据保护的备份领域。
数据从数据管理设备迁移到数据保护设备的过程,需要复杂的数据管理软件,不仅要管理数据备份、数据恢复过程,还要根据不同的应用需求制定相应的策略。VTL通过硬件或软件将磁盘存储空间虚拟为物理磁带存储空间,并模拟物理磁带库的机械臂和驱动器等部件,能够在传统备份软件上实现和传统物理磁带库同样的功能,因而可以直接利用已有备份软件的所有强大管理功能。
图1 用户在当前备份/恢复解决方案中遇到的难题
在传统的磁带备份中,备份恢复速度是困扰用户的首要难题。近年来,随着磁盘技术的快速发展,磁盘介质的容量得到了很大的提高,单位容量磁盘存储的价格也大幅下跌,基于磁盘介质的备份系统已经在用户IT环境中大量部署,并以其高备份恢复性能而逐渐被用户所青睐,VTL就是一个基于磁盘的备份产品新星。VTL产品兼有磁盘设备的高性能、易维护和磁带设备的先进成熟的介质管理等优点,一经推出,即获得了良好的成长,市场前景极为广阔。据IDC数据,2009年全球VTL市场达10亿美元(其中,中国VTL市场约0.4亿美元,Gartner数据),到2011年,该市场将突破13亿美元,每年新增市场超过1亿美元,发展非常迅猛。
2. Oceanspace VTL3500虚拟磁带库
Oceanspace VTL3500虚拟磁带库,是华为赛门铁克科技有限公司(以下简称华赛)VTL产品系列中的一款面向低端市场的备份解决方案产品。VTL3500通过软件将SATA磁盘阵列虚拟为物理带库,具有高性能和支持无缝部署等优异特点,同时,VTL3500支持重复数据删除技术,支持集成备份软件,可大幅减少用户IT投资。
2.1. 高性能、无缝部署
VTL3500可以提供优异的备份恢复性能,多流并发备份情形下,VTL3500的备份性能可达400 MB/S。
在传统的物理磁带库备份系统中,物理带库的备份恢复性能是极其低下的。首先,磁带库机械手的移动需要很长的响应时间;其次,物理磁带为顺序读写介质,读写磁头的频繁定位也很耗时;再者,物理带库备份性能也受物理驱动器数目的限制,以2个LTO-4驱动器配置为例,其理论上的最高备份性能为240MB/S;更糟糕的是,物理带库的恢复性能仅为备份性能的50%,如果需要恢复的数据涉及多盘物理磁带,则恢复性能会更低;此外,物理磁带库的性能扩展性也很差。要扩展物理带库的性能就必须增加驱动器,但物理带库支持的驱动器数目却极其有限,而且,增加驱动器也必然会迫使用户增加投资成本,同时物理带库系统本身的故障率也会上升。
VTL3500用软件模拟物理带库机械手,因此机械手移动时间为零;而且,VTL3500的存储基于磁盘这种随机访问介质,因而没有磁带定位时间;另外,VTL3500可以虚拟多个驱动器,并支持多个并发备份流,备份性能完全不会受到驱动器数目的限制;再者,由于磁盘读写性能几乎没有差别,因而VTL3500的备份恢复性能也不相上下,完全不会出现恢复性能远低于备份性能的情形;此外,VTL3500配置专用的RAID卡以管理控制系统的磁盘模块,并支持配置FC HBA卡以提供FC+iSCSI备份服务器接口,从I/O处理能力和数据通路两方面保证系统的高性能。
VTL3500可以完全模拟物理带库的功能、部件和特性,支持IP SAN和FC SAN备份组网,支持各主流的操作系统平台和备份软件,对传统的物理带库备份系统而言,无需改变现有备份环境,即可将VTL3500部署到现有备份系统。
2.2. 重复数据删除
重复数据删除是VTL3500众多优异的功能特性中倍受关注的焦点。
重复数据删除技术是一种数据缩减技术,旨在减小数据占用的存储容量。IT应用系统特别是备份系统中存在大量的重复数据:对于完全备份来说,操作系统数据、应用程序数据、数据库记录数据以及文件数据中均存在着大量重复数据;对增量备份来说,只有小部分内容发生了改变的文件,以及产生的文件新副本数据中同样充斥着冗余数据;对于多主机并发备份的应用来说,每个主机的操作系统、应用程序以及文件副本均含有相当一部分重复数据。实际应用中,备份系统中往往有多台备份主机,甚至有很多备份系统都是多个分支机构的数据向数据中心集中备份,备份策略也常常是将完全备份和增量备份结合起来。因此,备份系统可以从重复数据删除技术中获得极大的好处。
VTL3500提供重复数据删除功能,其重复数据删除比高达几十比一。使用重复数据删除功能,用户可以用更少的备份存储容量存储更多的备份数据,完全可以应对备份数据的急剧增长,也可以大幅减少存储投资。这也意味着,使用提供重复数据删除功能的VTL,用户可以使用相同的存储容量,在更长的时间内将更多的备份数据保存在VTL中,而不会出现由于存储空间的限制不得不将备份数据迁移到物理磁带进行离线保存的情形,这样,用户就可以保存大量的备份数据在线,从而支持更快速的恢复。
VTL3500的重复数据删除功能采用Offline删除机制,对备份恢复性能没有影响。VTL3500的虚拟磁带库软件包括VTL引擎软件模块和SIR引擎软件模块两部分。备份作业执行过程中,原始备份数据首先被存放到VTL引擎软件模块对应的存储空间,然后根据触发条件启动重复数据删除,重复数据删除的操作由SIR引擎软件模块完成。首先,SIR引擎软件模块读取原始数据并按照一定的原则划分数据块,然后,SIR引擎软件模块将所有划分的数据块和其对应存储空间中当前已有的数据块进行比较,如果和已有数据块重复则删除,否则将原始数据的数据块存入其对应存储空间,同时,原始数据块被清除,代之以指向SIR引擎软件模块对应存储空间中数据块的指针。重复数据删除操作结束后,原始数据全部被指针替代,它们所占有的存储空间又可以被下一批备份数据使用,SIR软件模块对应存储空间中则存放着所有的不同数据块。
VTL3500的重复数据删除功能还可以应用到其远程复制应用中。远程复制指的是:VTL中的备份数据以虚拟磁带的形式,通过IP网络复制到异地VTL中,以实现远程数据级容灾。VTL3500支持基于重复数据删除的远程复制,即通过IP网络复制的数据是执行了重复数据删除之后的数据,因而可以大幅减少远程复制传输的数据量。在相同网络带宽情况下,VTL3500的基于重复数据删除的远程复制功能可以大大缩短远程复制的时间;在相同的可用复制时间窗口内,VTL3500的基于重复数据删除的远程复制功能又可以显著降低远程复制对网络带宽的需求。
以30:1重复数据删除比计算,表1给出了不使用重复数据删除和使用重复数据删除情况下进行远程复制的对比说明。
表1 不是用重复数据删除和使用重复数据删除的远程复制对比
备份数据量 |
WAN链路 |
不进行重复数据删除的复制时间 |
进行重复数据删除后复制时间 |
不进行重复数据删除情况下,将复制时间控制在20小时以内需要的WAN链路 |
使用重复数据删除然后进行远程复制每年可节约的费用 |
2 TB |
T3 |
110 hours |
4 hours |
OC3 + 2 x OC1 |
$168K - $702K |
5 TB |
T3 |
276 hours |
9 hours |
OC12 |
$1M - $3.5M |
10 TB |
OC1 |
476 hours |
16 hours |
2 x OC12 |
$2M - $7M |
25 TB |
2 x T3 |
690 hours |
23 hours |
OC48 + OC12 |
$4.5M - $9.5M |
50 TB |
OC3 |
794 hours |
26 hours |
2 x OC48 + OC12 |
$8M - $15.5M |
注:
T3链路速率 = 5.5925 MB/s – 10%负载损耗 = 5.03 MB/s, 链路费用为$7 500-$14k/month
OC1链路速率 = 6.48 MB/s – 10%负载损耗 = 5.83 MB/s, 链路费用为$9k-$18k/month
OC3链路速率 = 19.44 MB/s – 10%负载损耗 = 17.49 MB/s, 链路费用为$10k-$30k/month
OC12链路速率 = 77.76 MB/s – 10%负载损耗 = 69.984 MB/s, 链路费用为$100k-$300k/month
OC48链路速率 = 306.104 MB/s – 10%负载损耗 = 275.4936 MB/s, 链路费用为$300k-$500k/month
综上,VTL3500的重复数据删除功能可以大幅节约用户的存储投资,同时,对用户的备份窗口没有影响,而且,该功能的使用还可以显著缩短远程复制所用的时间。
2.3. 支持集成备份软件
支持集成备份软件是VTL3500的又一个亮点功能特性。
备份系统必须包含备份软件、备份客户端、备份服务器和备份介质,备份客户端所在主机的业务数据,在备份服务器的作用下迁移到备份介质,从而实现业务数据的备份。备份客户端由用户的业务主机和备份客户端软件组成,备份服务器一般由单独配置的服务器主机和备份服务器软件组成。
VTL3500的支持集成备份软件的功能,指的是支持将备份服务器软件直接安装在VTL3500中,这样VTL3500既是备份服务器,又是备份介质。使用VTL3500的这一功能,用户无需额外配置备份服务器,即可构建备份系统,显著节约用户的存储投资。
3. 结束语
华赛Oceanspace VTL3500虚拟磁带库产品定位低端市场,可以为用户提供优异的备份性能,同时,VTL3500提供图形界面操作管理方式,具有广泛的兼容性,可无缝部署到现有备份系统,完全能够满足广大中小企业用户的应用需求。VTL3500从广大用户的切身利益出发,虽然定位低端市场,却拥有重复数据删除和支持集成备份软件等中端同类型产品才有甚至没有的优异特性,具有很高的性价比。