CommVault:不做一体机硬件,去重何处加强?

  也就是说,CommVault开始进入医疗数据归档软件领域的竞争中,深入行业的做法能够挖掘更多的用户需求,也可能说明原有备份功能的用户希望有统一的供应商解决方案。

  第四代重复数据删除:并行、SSD hash加速

  在我们翻译的“IDC:2012年4季度全球专用备份设备市场增长9.7%”中,可以看到赛门铁克在PBBA领域的显著增长。结合硬件的NBU 5200和BE 3600系列的成功,主要得益于原有备份软件的用户基础。而这样做也有代价——失去了像戴尔这样的合作伙伴,这可能就是CommVault坚持做一家软件公司的原因(通过戴尔这个渠道的销售曾占到CommVault整体收入的1/4)。如今戴尔收购的AppAssure和Quest都有数据保护软件,而CommVault与他们的合作仍然保持。

  尽管没有做像赛门铁克那样的软硬件备份一体机,但CommVault也在加强他们软件对应的功能。Simpana 10带来的第四代重复数据删除技术提出了并行去重的概念(目前支持2节点),由于没找到合适的示意图,下面我们拿曾经在《重复数据删除竞争白热化:软硬结合成关键》一文中参与对比,同样为双节点的IBM TS7650G ProtecTIER来做个参考。

CommVault:不做一体机硬件,去重何处加强?

IBM ProtecTIER HYPERFACTOR重复数据删除示意图

  我们看到左边是介质服务器,数据由它们写到ProtecTIER目标端去重网关设备上——也就是中间的双线内重复数据删除引擎,经过处理后存放在单一存储库(全局文件系统)上。

  由于CommVault实现的是在介质服务器和源端(备份代理)的软件去重,所以它的双节点就相当于把中间那两个引擎换成了Simpana介质服务器,左边直接就是应用服务器,右边应该是共享的磁盘阵列

  目前赛门铁克NetBackup 7.5和运行该版本软件的NBU 5220能够支持全局重复数据删除,但看资料需要配合使用多节点的NBU 5000系列目标端去重硬件设备,而不能在通用硬件上实现。而目标端设备方面,惠普StoreOnce B6200可以扩展到4个节点对,而高端VTL厂商Sepaton也是Scale-out(横向扩展)最多8个节点。CommVault未来应该可以扩展到2节点以上。

  在回答笔者的问题时,蔡报永表示:“CommVault的多节点去重可以针对单一任务(备份数据流),容量和性能都有加强。根据生成hash(哈希值)的奇偶性随机分配到A/B两个节点,进行重复数据删除处理再写入后端共同连接的盘阵。”根据我的理解,这应该是使用到了源端重复数据删除,因为数据在发送到介质服务器之前,就已经生成过hash了。那么如果只使用介质服务器去重的话,情况应该有所不同,但估计也能多节点并行操作。

  有了双节点之后,CommVault的介质服务器+去重也具备了高可用功能。因为在每个节点上只存放hash库而没有实际数据,在出现单节点故障时备份数据流可以由另一个节点承担,与本地的hash进行对比并写入后端存储。在故障节点恢复后再重建上面的hash库。

  ChinaByte比特网:我们看到Simpana 10的增强功能包括SSD的支持,这个是为了存储重复数据删除元数据、备份索引等用途吗?

  蔡报永:“没错,SSD就是在使用重复数据删除功能时,推荐来存放hash去重库的。”

CommVault:不做一体机硬件,去重何处加强?

  上表来自CommVault的资料,最左边一列是4种重复数据删除(介质服务器)节点类型,Sm(小)、Med(中等)、Lar(大)和XL(超大)。对应的依次是推荐的DDB(去重数据库?)卷大小、估计的后端大小(物理存储容量/RAID保护前?)、估计的前端大小(RAID保护后的物理存储容量?),以及配置举例。

  最右边一列,应该就是重复数据删除hash存储库的所在。从小到大分别为4-8个15K