NetBackup 7.5:放下磁带,才能走得更远?

  首先,笔者想澄清一下本文的标题:“放下磁带”,不代表最近推出的新版本赛门铁克NetBackup 7.5软件不再支持磁带(当然也不太可能这样),也不代表NetBackup原有针对磁带的功能特性有什么弱化。只是磁盘在数据保护领域正扮演着越来越重要的角色,特别是备份应用;而未来若干年中磁带仍将在海量数据归档、不活跃数据长期保存等方面发挥其价值。(延伸阅读:来自磁带峰会的报告(上):71%恢复失败的谬论、(下):受投资而非技术驱动)

  在讨论NetBackup 7.5在虚拟化以及磁盘支持等方面的新特性之前,我们先提一段小“插曲”,在本月IDC公布《2011年第四季度IDC季度存储软件跟踪》的新闻中,前3名EMC、IBM和赛门铁克的市场份额分别为25.7%、19.8%和15.4%。当时这个令笔者有点意外,因为在之前的很长一段时间赛门铁克都排在第2位,而上季度一下就落后IBM这么多?

  随后来自国外媒体的一篇报道解释了其中缘由:IDC的那个新闻稿与完整报告中的统计数字有出入,应该是前者出现了错误,实际情况应该是赛门铁克—15.4%和IBM—14.2%。

  IDC统计的存储软件市场包括存储设备管理、数据保护备份和归档软件等7个功能性市场。我们认为EMC排名第一与他们在存储硬件上的业绩是分不开的,EMC自称拥有市场排名第三的备份软件(Netwoker),IBM的Tivoli Storage Manager(TSM)有可能是第二,而第一应该就是赛门铁克全功能跨平台的NetBackup。再加上主要支持Windows环境并强调易用性的Backup Exec,赛门铁克在备份软件方面的占有率应该还是最高的。

  永久增量——适合磁盘时代的备份方式

  上面的小标题如果换一种方式,也可以说全备份和增量备份是磁带时代的产物。不知大家对这种说法是不是都认可,接下来请看一下我的解释是否有道理?对于存储备份领域的专家和赛门铁克NBU的用户来说,笔者在此可能有点班门弄斧了。

  首先,初始的全备份很好理解,而当过了一段时间数据有不同程度改变之后,按照传统的备份方式用户通常有两种选择:再次全备份和增量备份。选择前者将会重新备份整个数据集,即使有了重复数据删除技术之后,很多情况下还是需要将生产服务器/被保护主机上的全部内容通过网络再次发送至备份软件介质服务器(如果是源端重复数据删除或者在快照功能上与NetBackup集成的阵列,应该不需要传输冗余数据),尽管减少了备份占用的磁盘空间,但备份时间不见得会缩短,处理资源和网络带宽可能也没有节省。

  那么,增量备份只会对全备份之后新增加或者改变的数据进行操作,这样就避免了上述反复全备份的一些问题。不过,增量备份在进行恢复到某一个时间点时,必须先恢复全备份,然后按顺序逐个恢复该备份时间点之前的所有增量。如果其中有任何一个失效,恢复就会失败。因此,很多用户都是每周至每个月做一次全备份,其间每天进行增量备份。

  再来看一下备份介质。磁带不具备像硬盘移动磁头那样的随机数据访问能力,因此备份、归档软件等对磁带的访问方式通常都是顺序流式读写。LTO-5规范的LTFS文件系统中索引分区的出现对媒体等行业有所帮助,但无法改变磁带本身固有的特点。

  对于传统的全备份和增量备份来说,一盘或者多盘磁带连续写入/读出正好符合这样的访问规则。不过到了磁盘时代,如果用户不需要多个恢复时间点的话,原有全备份+增量备份的的方式似乎就不太适合了。

  我们认为这就是CommVault、飞康等新兴的数据保护软件厂商力推磁盘解决方案的原因。飞康CDP(连续数据保护)的工作原理类似于建立在精细粒度快照基础上的备份,在一些情况下能够实现很小的RTO(恢复时间目标)和RPO(恢复点目标),这种方式利于实现数据的高可用和容灾。不过根据笔者进行过的测试,完全同步的CDP依赖于网络带宽和备份存储性能,会不同程度的影响生产存储性能(需要等待备份存储也写入返回ok),特别是在通过WAN进行复制时。因此实际使用更多的应该为15分钟左右的异步CDP。

  也就是说,备份和CDP仍然各有各的市场。另一种产品——VTL(虚拟磁带库)则是过渡的产物,它无法充分发挥磁盘随机访问的能力。就像有的业内人士所说:磁带备份时代领先厂商的产品系列,比如CA ARCserve、被EMC收购的(Legato)Netwoker、IBM Tivoli Storage Manager(简称TSM),可能还有赛门铁克Veritas,有些不愿放弃原来在磁带设备支持上的“遗产”,希望凭借这个门槛继续赚钱,而不想一下子转向磁盘备份。