CDP与快照:两种不同数据保护方法

  快照

  在媒体对持续数据保护(Continuous Data Protection,CDP)解决方案的报道迅速升温后,最终用户也受到CDP即时数据恢复和零数据损失的吸引,但是有一个问题还有待于回答:CDP与快照的区别是什么?选择的依据是什么?

  从表面上看,这两种数据保护方法有很多共同之处。但是仔细对比之后,会发现一些重大差别。

  根据全球网络存储工业协会(SNIA)的定义,快照(Snapshot)是对出现在特定时刻的数据的复制。换句话说,快照是一个数据集的静态图像,这个数据集可以是一个处于特定时刻的Oracle数据库或家用文件系统。

  快照的工作原理

  很多快照功能都可以归入两个大类之一:全复制或差别复制。

  全复制快照复制整个数据集。全复制快照常常通过称为镜像分离的流程来实现,3TB 数据库的全复制快照占用额外的3TB磁盘空间。

  差别复制快照仅处理上次快照之后出现的增量。这类快照占用较少的磁盘空间,但是需要更多的系统处理开销。差别快照技术有几种实施方式,如写即复制(CoW)、写即重定向(RoW)和随处写(WA)。

  这两种快照方法的重要区别在于存储成本和性能。此外,因为全复制快照不依赖于主数据,所以这种方法往往使某些类型的数据损坏更容易恢复。

  快照价值主张

  备份窗口

  快照可以迅速建立,并可用作传统备份和归档的数据源。因为宕机或应用中断窗口缩小为快照建立所需时间,所以快照可以缩小或消除备份窗口。

  恢复窗口

  快照存储在磁盘上,而磁盘可以快速直接存取,这与磁带较慢的流式存取完全不同。从磁盘恢复比从磁带恢复速度快,而且就差别复制快照而言,还无需复制整个数据集。恢复所需时间常常称作恢复时间目标(RTO)。

  多个恢复点

  很多时候由于快照建立时刻延迟而使数据损坏无法恢复。中午时刻建立的快照对于发生在上午11:59的数据损坏毫无用处。因此,有灵活和频繁的恢复点、或称恢复点目标(RPO)是很重要的。客户有时对快照进行旋转,以获得更高的RPO粒度。但是快照增多的代价是极大地提高成本。

  重新确定数据用途

  用户常常要执行辅助操作,这些操作在生产系统上进行太昂贵或容易引起混乱。这些辅助操作可能包括归档之前的审计、报告、应用或升级测试、数据挖掘,等等。快照为这些操作提供一份接近实况数据的拷贝。

  CDP

  “持续数据保护”中的关键词是持续。就给定数据集而言,CDP提供一个恢复点的连续体,能够存取任何时间点上的数据,而不仅针对那些由快照流程预先确定的特殊时刻。CDP允许应用恢复到特定事件之前,而不是恢复到预先确定的时间点上。恢复点在事件发生后选定并动态重建。

  CDP提供粒度无限的恢复点(RPO),有些情况下可以提供接近即时的恢复时间(RTO)。这是因为,一般情况下,一有写操作就进行CDP保护。每一次数据修改都记录在案,恢复可以发生在任何时间点,时间点的划分可以一直细化到单个写操作。

  微粒度恢复

  CDP保护的一个重要优点是其微粒度性。对单个时间点图像的复制操作由于没有其他选择,就整个数据集而言缺乏微粒度性。有些复杂的方法可以用来实现一致性,但是在大多数情况下,单个时间点技术不具有微粒度性。这意味着,要建立一个恢复点,应用一定会受到影响。获取快照时,应用一般以某种方式置于静态。这个过程很复杂,而且容易引起故障。

  基于CDP的恢复具有微粒度性,这种方法可提供一个完整的数据集,无论应用在恢复时是否是静态的,数据集都可以恢复。这种能力常常称为紧急事故一致恢复,与容错和高可用性系统中采用的恢复模式相同。

  由于与生俱来的微粒度性,CDP可以实现非常强大和易用的恢复流程。

  恢复效率

  有些CDP方案允许其RPO选项随着时间的推移向下移交。任意时间点恢复按照政策提供给一组时间段,而较靠后的时间段只能从专门存储的恢复点恢复。具有这种能力的CDP系统可以延展自己的恢复时间表,同时降低存储容量需求。

  CDP价值主张

  备份窗口

  与快照类似,CDP去除了备份窗口。与大多数快照不同的是,CDP这么做是自动的,无需应用交互或干预。由于CDP恢复具有动态和非破坏性的特点,所以用户能够在不损坏内容完整性的前提下审计备份。