如何精简企业主存储上的数据
作者:George Crump
本文作者为George Crump,他是Storage Switzerland 及 Storage Switzerland Events的创始人兼主席。
在过去几年,数据精简技术,如压缩和最近的重复数据删除,开始流行起来,尤其是在备份和存档中使用。这一趋势是否会延续到主存储?
在备份中,特别是有大量的冗余数据时,有一个广泛采用的数据精简技术——重复数据删除。短短几年中,在数据中心里,重复数据删除已经从一个晦涩的术语变成了一个人所共知的词。重复数据删除消除多余部分数据的能力为备份储存和某些类型的档案存储带来了很大的好处。在备份数据方面,假设每周进行一次全备份, 120倍的存储效率并不鲜见。
主存储是不同的
不幸的是,移动重复数据删除到主存储并不是转移其位置这么简单。下面的提纲是主存储规划重复数据删除的特别要求:1、主存储性能敏感。主存储是积极的,如因执行重复数据删除而影响了生产环境的性能表现,是不能接受的。重复数据删除技术必须是高效快速的,它不能影响性能,或者它必须这样做出来的波段上的文件不会立即活跃。
理想状态是:在近线存储产生数据备份时进行重复数据删除,消除了任何可能的性能影响。这种技术重复数据删除和压缩水平不同,所提供的效率也不同——重复删除的水平越高,数据读回时对性能的影响越大。如果能有一个足够快的内置系统——既能减少数据,又不不影响性能——是很好,但这种技术现在还不存在。
2、主存储是独一无二的。缩减主存储的另外一个挑战是,数据是独一无二的。这和备份的情况完全不同。备份,特别是每天或每周一次的全备份,有较多数据冗余。而生产数据,尽管可能会有一些重复——比如同一个数据库的"额外"副本,但大多数情况下,数据冗余并不像备份或归档那么多。
随着基于磁盘的归档和磁盘备份变得更加普遍,主存储的冗余数据更少了。过去,保存数据库或文件的额外副本的价值是 "以防万一".现在这些副本,可以很容易地发送到磁盘归档或磁盘备份设备当中。(这是一件好事! )
注意:当前用户期望看到的存储效率提升20倍或更多,在主存储就不要想了。一个更现实的目标可能是3倍,最多5倍。
3、主存储已经压缩过。此外,大部分的主存储的数据已经是预压缩格式。文件,如图片,媒体文件,和特定行业的数据集,是已经预先压缩过的。即使最新版本的流行的office应用也是预先压缩的。这些预压缩文件,往往代表了企业增长最快的最大的数据集。
为应对生产数据的"独特性"和"预压缩",一个成功的主存储精简技术需要"挖的更深" .内置的数据精简在备份和存档有明显的优势,但生产存储中,带外管理会更有效。
在没有数据精简时间压力时,可以花时间研究复杂的复合文档,并从数以百万计的文件中找出相似的一个文档。这种方式可以花时间了解具体的格式——如J PG格式是如何存储的,如何嵌入到另一个文件的(例如,P o werPoint简报);数据精简如何对原始数据及其嵌入状态进行最佳优化的。
4、主存储越来越便宜。重复数据删除的最后一项挑战,就是不断降低的磁盘价格。最后终结HSM 和ILM的可能会是主存储数据精简的落实。随着顶级存储制造商开始生产1T的SATA硬盘,购买大容量的存储空间越来越容易。
从精简主存储获益
首先,精简主存储的价值体现,一个前提就是:正在处理中的数据量一定要大,可能得大于20 T ,才能看到一个不错的投资回报率。举例来说,将50T减少到10T ,比从10T减少到2T更有吸引力。
第二,不仅仅是物理存储成本,其他因素也都必须要考虑到。通过提高存储效率,能源和空间效率将会减少。许多数据中心最大的挑战就是空间和能源问题。
此外,特别是一个带外解决方案,如果可以选择带外读数据,对备份存储和网络带宽利用率可能都有显着的积极影响。
存储系统大量应用压缩或是继续进行数据优化应在备份窗口以及备份存储系统上确定一个可测量的缩减。数据还可以发送到基于磁盘的可以消除重复发生的压缩数据(多个每周完整备份)的重复数据删除技术上。以这种方式进行数据压缩使数据变得更加便携,更有利于在在WAN发送。
更多关于 重复数据删除,备份,主存储,数据中心 的文章
- [虚拟化]VMware公司正式宣布进军移动虚拟化
- [多核]推多款“上海”服务器 Dell力挺AMD
- [OS]7个极其具有杀伤力的Linux命令
- [备份]用户看重硬件容量优化
- [新闻]数据裂变:数据以生物形式快速增长
- [新闻]面临财务危机 “日蚀”或将到来
- [虚拟化]谁需要移动虚拟化?
- [多核]“上海”能给AMD带来什么?
- [HPC]全民HPC时代——从最新HPC TOP 500说起
- [刀片]惠普虚拟化刀片服务器采用SSD盘
精彩专题
- [虚拟化]谁需要移动虚拟化?
- [多核]“上海”能给AMD带来什么?
- [HPC]全民HPC时代——从最新HPC TOP 500说起
- [新闻]年内将有18万IT精英失业
- [网页技术]什么是CMS?CMS是什么意思?
- [新闻]未来十大热门专业全纵览
- [SEO]站长必读:推广网站最实用的77种方法
- [新闻]全球10%域名系统服务器仍处于裸露状态
- [主机托管]网络安全不容忽视 企业服务器托管导购
- [虚拟主机]2008年中国虚拟主机服务商排名
- [姜子牙]Sun公司面临陨落
- [jyiufe]ARP攻击防御术心法
- [papada]生命游戏 c语言完成
- [淡月]裁员名单让你一次看个够!
- [wope]Linux命令之网络安全基础知识
- [obfw]机房网速缓慢真相
- [owenglyn]杨致远下课了我有点难过
- [ekkq]过255台电脑的内网IP规划问题
- [owenglyn]10位伟大IT界CEO你最服谁
- [wujie]window shopping的启示
- [jyiufe]对Android平台Linux部分理解
- [DU的世界]网络安全忍无可忍!
- [rugg]Java专业术语标准化规范
- [天空空]谁扼杀了VoIP革命?
- [bigrong]ASR 9000让你不明白
- [姜子牙]AMD发布“上海”皓龙处理器
- [牛牛]如何避免办公室沦为免费网吧
- [姜子牙]服务器虚拟化之后的热点是?
- [fxingji]C语言高效编程的四大绝招
- [小希大人]08微软技术大会现场[图]
- [软件下载] 最流行磁盘碎片整理工具
- [软件下载] 最强大的PDF工具包
- [软件下载] 3GPMP4视频音频转换工具
- [争议人物] 杨致远:给雅虎的一半阴霾
- [争议人物] 李彦宏:IT企业家的霸气
- [争议人物] 杨致远解释辞职原因[图]
- [争议人物] 快钱副总托马斯离职
- [争议人物] 名人刘韧被警方正式批捕
- [IDC专区] “CMS文章”的汇总贴
- [IDC专区] 让中国web2.0去死!
- [网络安全] 能解任何电脑的开机密码
- [网络安全]教你如何防范U盘病毒
- [网络安全] 把自己的IP地址隐藏起来
- [网络安全] 六大措施保障网络安全
- [网管专区] 教你如何分辨网线的好坏
- [网管专区] 利用Sniffer做被攻击分析
- [网管专区] 网络协议工具测网络故障
- [网管专区] 某证劵网络故障排除实例
- [系统应用] 30秒完成清除任务
- [系统应用] 无线网络下载小技巧
- [新闻]Alexa世界排名作弊分析
- [SEO]网站推广十忌
- [网页技术]WEB 2.0图形设计样式指南
- [新闻]让中国web2.0去死!
- [新闻]百度信任危机 李彦宏内部电邮辩白
- [新闻]危机公关,百度为何能医不自医
- [新闻]众里寻他千百度,答案却在何处?
- [新闻]谈谈百度门事件和站长的关系
- [新闻]谷歌反驳垃圾信息是搜索不公正主因
- [新闻]对症下药 如何防止被百度潜规则
- [数据中心管理]IBM成立中国NEDC领导力中心
- [虚拟化]VMware公司正式宣布进军移动虚拟化
- [多核]推多款“上海”服务器 Dell力挺AMD
- [新闻]Alexa世界排名作弊分析
- [SEO]网站推广十忌
- [新闻]从百度事件看网络规则非虚拟性
- [新闻]面临财务危机 “日蚀”或将到来
- [虚拟化]谁需要移动虚拟化?
- [多核]“上海”能给AMD带来什么?
- [HPC]全民HPC时代——从最新HPC TOP 500说起






