周报全文
2007-08-01 14:04    文章来源:网界网

[周报全文]重复数据删除 难走的平衡木

作者:网界网特约专栏作家 张峰


 

重复数据删除技术与VTL如果能够配合好,就能够为用户带来巨大价值,但是,配合的技术很难拿捏。

【CNW.com.cn 专稿】笔者接触到的用户,使用虚拟磁带库(VTL)的最大收益是在很大程度上摆脱了磁带管理的复杂工作。但这都是一些拥有专业存储管理人员的用户。相反,那些没有专业存储管理人员的用户,尽管在概念上很认同虚拟磁带库的优势,但是,基本上都不太愿意部署,因为在他们看来那样做是一种冒险行为。

但有分析家们认为,异军突起的重复数据删除技术,将会改写存储行业的经济规则。企业策略集团(ESG)的资深分析师Tony Asaro认为:“借助重复数据删除技术,实际存档的数据将会呈几何级别递减,大幅削减存储成本。”也有其他分析师认为,用户的存档数据所占用的空间将会缩减为原来的5%

也有相反的观点认为,独立发售的重复数据删除软件市场并不像人们预想中那么大,特别是考虑到微软公司在其新近推出的Windows Storage Server 2003 R2中也添加了该项功能,如果这项技术被嵌入到文件系统内的话,那么,另行购买重复数据删除软件的意义就不是很大了。二级存储器的价格将变得越来越便宜,添置更多的磁盘,对于企业用户而言也就不会造成过重的经济负担了。

所以,重复数据删除技术恐怕只能吸引那些对主存储器十分倚重的企业机构,可是当数据库的规模达到一定程度之后,传输速度很难达标,每次写入数据时,系统都要校验所有的数据块,避免冗余,这样一来,延迟时间将会大大拉长。

如此看来,就目前的应用情况来看,重复数据删除外加虚拟磁带库的整合解决方案,还在一定程度上处于不完善的地步。

重复数据删除的最大优势是节约备份磁盘的空间,从而让磁盘在与磁带竞价时具有一定的竞争力。大家仿佛都在争先恐后地提高重复删除的比例,以降低磁盘的使用率。可是,另外一方面,重复数据删除对于每种具体应用的删除比例是多少?这个比例的提高对性能的具体影响有多大?VTL外加重复数据删除功能对于多大规模的数据库效果最好?这些都是很难回答的问题。

因此,用户在选择降低磁盘性能与提升磁盘空间使用率时应考虑周全,就像走在平衡木上需要保持平衡一样。但是关键在于,无论是厂商还是用户,大家都缺乏经验。也许只有经过几年的积累,用户才能够有能力走好这个平衡木。但付出的代价会很高,也许得到的只是教训。

这就是目前许多大型数据中心都不愿意尝试VTL加重复数据删除的原因。与节约空间或者免除磁带管理的复杂工作相比,可靠性、可用性的优先级则更高。只有那些对业务、数据情况非常了解,而且具备丰富存储经验的用户才会尝试。既然需要尝试很多问题,那么势必影响到这些技术的迅速普及。

业界对VTL和重复数据删除的态度多数是正面的,大家都认为如果用户拥有足够的技术走过这个平衡木,自然会得到很好的效果。可是,这种平衡技术容易普及吗?别人需要一段时间摸索出来的经验,对于我们自己的应用情况适合吗?这些才是大家更关心的。

责任编辑:程永来

文章评论

评论加载中...请稍后

精彩专题