当LTO2磁带库“老”的时候
查看评论 发表评论2009年03月12日 10:13分 作者: 来源:
——渤海财险数据备份管理系统升级记
【CNW.com.cn 专稿】渤海财险成立于2005年,是由天津泰达、天津泰达投资、天津联津投资、天津保税区投资以及北方国际信托投资等五家股东单位发起成立的。作为一家年轻的企业,渤海财险充分利用了后发优势,在信息化建设上采用了大集中的模式,透过大集中的数据中心为25家省级分公司、100家地市级机构和147家县级机构提供统一信息化服务支持。采用大集中模式,分公司等分支机构在当地并不保留任何数据,只是通过专线接入大集中的数据中心,享受统一专业化的服务。大集中强化了企业管理,规范了行业服务标准,同时减少了信息化管理的成本,是一种高水平的企业信息化服务管理方式。
据渤海财险信息技术部总经理王效敬介绍,公司领导对于信息化的工作高度重视,在短短三年时间内,已经先后构建了核心业务、财务、车险理赔、销售、重点客户关系管理、电话销售、客服、办公等大大小小十几个系统,运用信息化手段,给公司的保险业务开展提供了强有力的支持。截止到去年8月,公司已经实现年保费收入突破10亿元;理财型产品收入突破40亿元。上佳的业绩表现,让公司股东们对于公司的工作高度认可,去年8月股东再度追加注册资本5.5亿元,为公司发展注入了新的动力。
幸福中的烦恼
与银行相比,保险公司的信息化投入相对少一些,专业技术人员也少。渤海财险也不例外,整个信息技术部也不过只有十几个人,但是总体发展还是比较顺利。但是不久前,在备份方面的磁带库出现了故障,却给信息化管理带来了不小的麻烦。
作为数据大集中方式的信息化应用,数据安全性对于信息技术部而言是一个严峻的考验,为此,王效敬也承受了很大的压力。在信息系统规划之处,它们就采用磁带库对核心业务系统数据进行备份。当时所采取的是某厂商的专业化备份软件,使用LTO2格式磁带库进行备份。在业务开展之初,数据量比较小没有太多的问题,随着业务的开展,老的磁带库的问题就暴露出来了。据渤海财险信息技术工程师王辉介绍,一来旧磁带库所能使用的磁带容量比较小,需要技术人员把数据库数据导出来,进行数据压缩,然后再转储到磁带上;此外,该备份软件对专业性要求比较高,界面又不是非常友好,使用起来的难度比较高,并且没有任何报表功能和报警机制,例如磁带机有时候会因为各种原因,如磁带没有及时更换,系统宕机等造成备份失败,如果技术人员没有发现,非常容易给数据保护留下隐患。但是就是这样的局面也变得难以为继,前不久老的磁带库出现了硬件故障,坏掉了,备份工作不得不暂时中断。
根据业务的需要,信息技术部引入了新的LTO3的磁带库系统,但是问题并没有得到解决。原有的备份软件与新的磁带库系统不能够很好兼容。以LANFree的工作方式为例,它可以有效减少业务系统的负担,不占用承担业务生产的网络资源,但是在使用新购置的磁带库时发现现有的备份软件不支持此方式。为此,他们要求软件厂商提供技术支持,但是系统构建之处,受资金的限制,渤海财险方面没有购买软件服务,软件厂商拒绝提供服务,并且要解决此问题,只能是采用该备份软件的最新版本,由于渤海财险这几年都没有升级软件,只能购买全新的备份软件。为此,在综合考虑管理成本、备份性能和采购成本,并经过了广泛的调研和测试后,王效敬决心更换备份软件,并最终选择了CommVault的Simpana 7.0集成一体化信息管理软件。
并不艰难的决定
在数据备份领域,更换核心备份软件并不是一件轻松的事情,因为随着业务的开展,会有大量的旧友软件备份下的数据,这些数据常常保存在磁带。对于旧有的历史磁带数据,如果采用新的系统,常常由于兼容原因无法读取,这就限制了新软件的采用,尽管新的软件有很多先进的技术和方法,但还是会被历史数据的门槛挡在门外。
对于历史数据,渤海财险的情况还是非常幸运的。现实情况的是从2005年开始的数据,仍然存储在主存储系统之中,不存在磁带历史数据的导入问题。采用新的磁带库系统,配合CommVault软件,渤海财险很快弥补了数据安全保护方面所存在的漏洞。在备份策略方面,渤海财险要求重要数据库系统每天必须做全备,理赔图片数据,由于涉及大量小型图片数据(大小80K左右,目前总量400G以上,年增长200G以上),每周做一次全备份,每天进行增量备份。据了解,现有十几个系统,数据量少则几十GB,多则已经接近了1TB,虽然数据总量并不大,但是也对存储系统构成很大压力。通过数据迁移和归档的方法,可以在一定程度上释放存储的压力,盘活存储资源。这样的方法也在渤海财险的考虑之中。
简单就是硬道理
“CommVault的突出好处就是它的一体化管理。”王辉说。CommVault Simpana将备份恢复、快照、复制、迁移和归档等原本独立的软件,统一构建在一个统一的通用技术引擎(CTE)平台上,通过CTE提供统一的图形界面、分类目录、测试管理、数据移动等支持。如此,不仅实现了原本需要多个分立软件才能实现的功能,更为重要的是借助底层的CTE平台,系统的效率得到了极大的提升,特别体现在恢复的效率上。“如果采用其他管理软件,不仅需要独立安装,并且需要分开维护。对于我们用户来说,主要是用起来省心,能达到目的就可以了。从这个意义上看,一体化真非常让我省心,它有自己的一个事件管理器,每天我只要看看有没有报错就得了。”王辉说。
这里谈到的事件管理是Simpana的一个特色。透过日志的收集,辅助以强大的报表功能,它随意定制任何的周期,把这个周期上发生过的任何事情,都以不同的形状、图形的颜色显示出来。“不管是领导层需要,还是数据增长量,还是每天备完的数据,随时都可以知道自己数据情况,根据需要生成各种报表。” 王辉说。
“我还看好Simpana的索引技术,它查找文件非常快。我试着在几十万个文件里,查找历史版本的一个小文件,它定位特别快,可能直接指向到磁带的某一个具体位置。我们的文件系统有几百个GB,但都是小文件,每个文件不过80K, 所以总文件数量有几百万个。在这样的海量数据中,要恢复一个小文件,在过去是很难想象的,但Simpana做到了,而且效果非常好。采用Simpana后,数据备份只用4个多小时就完成;而原来的软件,需要用40多小时,快了整整10倍。”王辉表示。快照与演练
快照技术是实现连续数据保护(CDP)经常采用的方法,渤海财险所采用的主存储系统也支持快照功能。“但是主存储已经没有空间了,影响了快照的应用。”王辉说。
据CommVault资深系统工程师宋勇刚介绍,快照最主要问题在于需要占用磁盘空间,每进行一次快照都要占用一部分存储。但是快照对于数据保护的作用明显,用户可以随时快照时间点的数据。硬件快照技术需要与备份软件进行配合,来实现完整数据保护方案。他表示,备份软件对于快照的支持非常重要,以数据库为例,哪怕仅仅是数据的微小变化,如果对于数据缺乏了解,备份软件就会将其视为新数据其结果将导致数据的快速膨胀,不堪重负。把这些因素处理好了,备份才能够做到高效,才能够实现快速的数据恢复。
相对于备份而言,恢复更为重要。按照保监会最新公布的要求看,要求RTO(目标恢复时间)为6小时,也就是要求系统能够在故障后的6个小时内恢复运行;对于RPO(恢复点目标)要求为8个小时,也就是说能够恢复到系统8小时之前的状态。
“我们也在朝着这个方向努力。” 王效敬。“异地容灾需要投入巨大,除了少数大的保险公司之外,多数保险公司还做不到。现阶段,主要还是以数据备份为主。为了确保数据的安全、可靠,我们也下决心做好恢复演练。我们的计划在异地,比如北京或者其他地方,租一些服务器,进行恢复演练。”
王效敬表示,今年的金融危机,会使IT投资受到一些影响,但是还是会下决心做好数据的恢复演练。就算现在没有灾备中心,只要数据可以恢复,它意味着公司的根基依然牢固,就可以抵御更大的冲击和损失。
关键字:
| E5的盖头掀起来 北京时间3月7日下午,英特尔在中国正式发布英特尔至强处理器E5-2600/1600产品家族。E5究竟有哪些革命性的创新,它的推出对整个服务器产业又将有哪些影响,且让我们一一道来 |
云存储服务 路向何方 经历了13个月的起起伏伏,Atmos Online云存储在线服务还是没有逃脱夭折的命运。对那些一直看好云存储服务的厂商和用户来说,这也许是一个沉重的打击。 |
- 本周TOP10
- 本月TOP10
北京时间3月7日下午,英特尔在中国正式发布英特尔至强处理器E5-2600/1600产...
万兆以太网未到水穷处,100G路由已至云起时。在笨鸟早已被淘汰的网络市场,...
站在年关,回顾2011年信息安全领域那些事。我们会发现在2011年信息安全领域...





