西北证券灾备一体化方案

来源:互联网 发布:被扔下19楼的女孩知乎 编辑:程序博客网 时间:2024/04/27 20:37

西北某证券股份有限公司是经中国证券监督管理委员会批准设立,于2001年元月正式注册开业的证券经营机构,注册资本金壹拾亿元人民币,注册地为陕西省西安市,公司在上海设有投资管理、客户资产管理、投资银行、研发中心等业务部门,并在陕西、北京、上海、深圳、山东设立了22家证券营业部和14家证券服务部。

  业务需求

     西北某证券集中交易系统在2005年实现交易集中并升级到Linux + Oracle平台,系统稳定运行。2006年以来,随着中国股市转牛,交易活跃,系统所承受的压力越来越大。一旦集中交易系统出现故障,将导致严重的后果。因此,西北某证券考虑升级以往的应用级容灾系统,采用专业的灾备软件对集中交易系统进行完善的保护,包括:

1)     实现灾、备一体化的数据保护

对集中交易系统实现灾、备一体化保护,即在出现地震、火灾、存储故障、大面积电力中断、网络中断等情况下使用容灾系统实现业务快速接管;在出现诸如表数据丢失、数据逻辑错误、软件BUG等情况下可以通过备份系统快速在线修复系统。同时整合两种灾备模式,做到全方位保护。

2)     实现本、异地结合,查询、容灾结合的数据同步

在中心机房和异地机房之间各保留一份同步数据。中心机房的同步数据用于历史查询、数据分析等,作为“温备”数据。异地同步数据用于容灾切换,作为“灾备”数据。

3)     强调应急处理及演习体制的建设,实现灾备制度保证

在关键时刻容灾切换是否能够成功,不但取决于灾备软件,而且和平时的灾备演练、系统维护以及应急体制息息相关。因此,西北某证券要求灾备系统的建设同时应建设应急处理制度、演习制度并形成规范文档和应急指导手册,切实提高容灾系统的应用效果。

  解决方案

根据西北某证券的实际情况,DSG采用Realsync+SnapAssure的灾备一体化方案来满足客户的需求。解决方案示意图如下:

 

 

      如上图所示:

1)      配置两套DSG Realsync软件,分别实现从本地交易服务器组同步数据到中心机房的查询服务器以及异地机房的灾备服务器,实现本地和异地的数据同步;

2)      同步到中心机房的数据,用于历史查询、数据统计分析使用;同步到异地机房的数据,基本上不使用,作为容灾数据;数据同步实时进行,保持和交易系统一致。

3)      配置1DSG SnapAssure软件,实现从交易服务器组到灾备服务器的异地备份。两地之间的网络为千兆单模光纤。

4)      备份到异地的集中交易系统数据,可以用来快速恢复或者在线修复系统。数据备份每个交易日执行一次,每次备份包括数据文件、日志文件、控制文件以及参数配置文件等。

5)      在项目实施中,分析系统可能遭遇的各种故障,根据故障情况判断故障等级和危害程度;分析两种灾备方式对不同故障的处理的优缺点,选择最优的处理方案,并写明详细的操作步骤,汇总成为应急手册。根据以上应急处理手册,进行日常的演习,通过平时的演练来促进系统故障时反应能力和故障处理能力。

  应用效果

西北某证券的灾备一体化系统是我国证券行业内采用先进的灾备软件构建关键业务系统全方位数据保护的首例。该系统建成后,可以实现:

1)  大幅提高集中交易系统在各种故障情况下的安全性。解决方案针对系统可能遭遇到的存储故障、主机故障、数据库故障、文件丢失、日志文件丢失、表丢失、数据异常、大面积停电、网络中断、地震等灾难都制定了相应的处理措施,从而为可能发生的故障准备好了处理预案。和其他的容灾解决方案相比,本方案的措施更全面和具体,更有针对性,覆盖了单纯的容灾技术无法解决的逻辑故障问题这个技术死角,并且提供了更多的在线修复的手段,从而令客户在面对各种灾难是能够选择最合适的方案进行快速处理,把对系统的影响减小到最少。

2)  应急处理措施与技术手段融为一体。在本项目中,除了软硬件系统的安装配置,更多的精力被投入到针对具体故障情况下的切换、恢复以及修复等的处理和演练,从而将技术手段和处理故障的流程、机制等结合起来,从而为今后的系统维护、管理和应急处理铺平了道路。

3)  达到了更高的技术指标。测试表明,在通常的交易复制中,数据延迟时间为1-2秒;数据库的首次数据同步时间不超过20分钟,切换时间不超过5分钟;数据全库备份时间不超过半小时,增量备份时间数分钟,全库恢复时间11分钟。以上技术指标既表明了灾备软件平时运行的高效,也表明了故障情况下能够达到的处理能力。