部署主存储优化方案具有六大需求

  当前并不缺乏提高数据存储效率的新技术,但是这些存储技术大多关注备份和归档,而不是关注主存储。但是,如果公司开始精简主存储的数据,就必须了解主存储优化具有哪些需求。

  主存储通常称为Tier 1存储,其特征为用于存储活动数据——经常需要访问的数据,以及要求高性能、低延迟、高可用性的数据。主存储通常用于托管关键任务程序,如数据库、电子邮件和事务处理。大多数重要程序采用随机数据访问模式,具有不同的访问要求,但是都能产生大量数据,公司可以利用这些数据完成业务。因此,公司会创建大量的数据副本,复制数据供分布式用途,建立数据仓库,然后将数据备份和归档,实现安全保存。

  最初,大部分数据都是主数据。随着数据的存在时间增长,通常移动到次级和三级存储。因此,如果公司能够减少主存储的足迹,就能充分利用容量,降低整个数据生命周期的成本。换句话说,一部分主存储足迹转化为更少的数据,从而实现复制、存入仓库、归档和备份。

  压缩和重复数据删除技术

  主存储管理员试图减少主存储的足迹,可能会考虑两种数据精简方法:实时压缩和重复数据删除。

  直至最近,数据压缩技术才在主存储中得到广泛应用,而且是出于对性能的关注。但是,Storwize等供应商提供的解决方案采用实时、随机访问的压缩/解压缩技术,能实现15:1的足迹精简比。由于压缩比例和实时性能很高,压缩方案成为主存储数据精简的考虑方案。

  重复数据删除技术在备份程序中非常流行,同样也可在主存储中应用。这样,在成千上万的文件中识别数据冗余块非常费时,而且使存储处理器变得非常敏感,活动数据的性能也会受到影响。这就意味着只有活动数据陈旧到一定程度,才会被处理。这方面的供应商包括NetApp、Data Domain和Ocarina Networks等公司。

  部署主存储优化方案具有六大需求

  需求1:性能零影响

  与备份或归档存储不同的是,相比通过某种形式的数据精简才得以节省的容量,活动数据组的性能更为重要。因此,选择的数据精简技术必须对性能毫无影响。技术只需简单地发挥作用;相当于“打开某个开关,消耗的存储就相应减少了”。

  换句话说,这就意味着只对这类文件执行重复删除功能:今后不再访问,但仍位于活动存储池——不太活跃的存储层。

  重复数据删除技术能够避免性能瓶颈,因为其建议只删除简单并重复的I/O工作负荷。因此,IT基础架构的关键组件通常不能在存储中得到优化。位于关键组件清单之首的是数据库。数据库Tier 1存储中非常活跃的组件,不仅仅是一种简单的工作负荷,因此重复删除过程从来不分析数据库。这样,数据库占据的主存储空间并没有得到优化。

  另外,实时压缩系统能即时压缩流过产品的所有数据。这就具有很大的好处,除了节省容量,还能提高存储性能。压缩以后,每次I/O请求交付的数据量会大大增加,磁盘缓存空间扩大,每次读写操作的效率提高。

  网络效应也能精简磁盘容量,提高存储的总体性能。

  主存储重复删除的第二个好处是:所有的数据都得以精简,由所有数据(包括数据库)分担空间节省要求。Oracle环境下的实时数据压缩功能会产生性能问题,可以利用测试过程提高性能。

  问题的另一方面在于对存储控制器本身的性能影响。今天的存储控制器需要完成许多工作,而不仅仅是满足磁盘需求,还要管理各种协议、执行复制、管理快照。增加一项功能可能会超过控制器的承受范围,即使控制器能够处理附加的工作负载,存储管理员也必须认识到:多一项功能,可能带来I/O瓶颈。将压缩功能卸载到外部产品中,就移除了一个性能变量,完全不会影响存储控制器。