管理自动化事故

来源:互联网 发布:oecd投入产出数据库 编辑:程序博客网 时间:2024/05/16 01:17

  企业设计基础设施时,要准备应付意料之外的事情发生。

  世上不存在无风险的经营环境。最近发生的天灾,以及断电水灾等规模较小的事件,都在提醒人们,有必要未雨绸缪。

  安永(Ernst & Young)2008信息技术内部审计调查发现,在组织面对的最重要风险中,高管们把业务连续性威胁列在第三位。随着组织依赖于复杂的信息技术和电信,通常还加上外包的业务流程,灾难,无论是人为的还是自然的,对日常经营构成的威胁,已变得日益严重。

 “自动化程度越来越高,(首席技术官们)担心应用程序或结点的一个小组成部分可能会丢失,”安永技术、安全和风险服务事业合伙人理查德·布朗(Richard Brown)说。“一个小事件就很容易逐步升级成大事件。”
 
  这对信息技术部门、组织的首席财务官和首席风险官的挑战越来越大。简单依靠信息技术备份策略保护关键数据,连同用物理安全措施来保护职员和建筑,已经不够了。相反,企业设计基础设施时,需考虑留出弹性空间,同时要准备应付意料之外的事情发生。

  几乎不可能对每个应用程序提供最高级别的数据保护,那样成本过于高昂。
 
 “组织的计划需要建立在应用程序和数据区分优先级的基础上,”供应商CA负责软件工程的高级副总裁大卫·路夫(David Luff)表示。“如果是低优先级应用程序,那么在24小时范围内恢复是可以的,”他说。

  尽管如此,由于消费者的要求,加上官方往往也有命令,组织需要保持关键服务24小时运转,这种压力越来越大。同时,恢复窗口正在缩小。恢复窗口即组织能容忍在生意上不产生重大损失的离线时间。

  在一些行业,尤其是金融服务和保健行业,“恢复点”的时间已进一步缩小,迫使组织确保他们能恢复的数据的年份比先前要求的更长。

 “在消费者方面,组织已经意识到,消费者对停工期的容忍更为有限,但现在企业也清楚地知道,假如企业不是正常运转,也是不可接受的,”英国电信(BT)业务连续性、安全和管治全球负责人雷·斯坦顿(Ray Stanton)表示。

  一旦系统故障或灾难突袭离岸或外包业务服务,就很难甚至不可能再退回到先前的工作方式。“尤其在复杂的分布式环境中,服务和数据散布在全世界,组织必须更严肃地讨论业务连续性这个问题,”斯坦顿补充说。