单点故障--名词解释

来源:互联网 发布:python源代码 编辑:程序博客网 时间:2024/05/20 11:31

单点故障(single point of failure),从英文字面上可以看到是单个点发生的故障,通常应用于计算机系统及网络。实际指的是单个点发生故障的时候会波及到整个系统或者网络,从而导致整个系统或者网络的瘫痪。这也是在设计IT基础设施时应避免的。

详细描述

过重复部署现有的硬件设置,可以为Client Security(客户端的安全) 提供部分容错能力。
此时,如果某数据输入/输出 (I/O) 路径或某服务器(如计算机、网络或网络组件的存储区域)的物理硬件组件发生故障, Client Security 部署可以使用重复部署的硬件继续进行操作。可考虑的冗余硬件包括:双电源 双网络适配器 RAID 磁盘阵列 用来减少单故障点的硬件根据创建冗余的所使用的组件不同而不同。硬件供应商通常将重复的硬件部署作为其存储方案的一部分。
这里可以简单记为:某数据输入/输出 (I/O) 路径或某服务器(如计算机、网络或网络组件的存储区域)的物理硬件组件发生故障。

避免措施

首先也是最重要的是,每个域至少要有2个域控制器。如能负担费用,我建议准备3个,留有一个作为额外的保护层。
第二,域控制器不要放在同一个物理位置。准备至少2个机房。一旦有机房被人为破坏,起火或遭其他损害时,其他机房仍可以使用。
第三,部属多个AD依赖的系统。最主要的是DNS系统。确保在每个域中备份或准备两个DNS服务器。
第四,需考虑连接线。是否每个网络与域控制器间只有一条连接线?在每个域中部署至少2个网卡,这样可以通过多种途径进行访问。
显然这些建议会增加部署、维护AD基础设施的费用。但当问题发生时,这些防护费绝对比维修费(如相关责任)来得便宜,而且物有所值。

0 0