IT故障排除的方法经验总结

来源:互联网 发布:互联网家装经验 知乎 编辑:程序博客网 时间:2024/03/29 06:27

今天公司运营的平台出现故障,在指导值班人员排障过程中,发现他解决问题时犯了很多明显的错误,导致多用了一倍的时间才最终把问题解决。这些错误也正是大多技术人员都容易犯的,并不是很高深的道理,但实际运用之中确实容易犯错。在此总结下来,希望能对大家有所帮助,也防止我自己犯错。

 

首先,全面收集问题的现象,一定要对问题的表象有完全的掌握。

其次,分析所收集的现象,根据理论知识进行逻辑推理,排除不可能的情况,划定出可能的原因范围。在分析问题现象之前,必须先考虑出现问题时间之前做过哪些相关的变更(考虑的范围要宽,往往我们认为毫不相干的修改会造成预料不到的问题),判断问题是否可能与变更有关,可以尝试恢复变更。

再次,对划定出可能的原因进行逐一采取解决措施。在此过程中继续详细观察问题现象和采取措施后的现象,进行分析将问题原因范围减小。最终找出问题根源。

 

注意:

切记千万不要“想当然”,即应该是哪哪的问题,我只朝这个方向去采取措施。即所有的判断都必须是基于事实的,也就是说你的判断要经过你的实际测试来验证。

对收集的问题现象必须保证是绝对真实并经过验证的(有时用户描述的现象与实际是正相反的)。

不要完全依赖经验去做假设的判断,而是要尊重事实,你的每一个假设都要建筑在经过你测试的事实基础上。 

 

建议大家看一看微软的webcasts:《使您成为Windows专家的一些学习习惯》,里边也讲到了关于排障的正确方法。在以下链接可以找到http://www.microsoft.com/china/technet/webcasts     强烈推荐!!!