2013Q2 ERP巡检总结

来源:互联网 发布:java shell 代理 ip 编辑:程序博客网 时间:2024/05/01 18:40

记录下本次ERP巡检时遇到的问题,仅做自己经验总结。


2013-6-30,周日,去往南昌的飞机晚点两个小时,据说飞机飞到济南无法降落,又飞回南昌,然后再飞回来,不知道真假。


2013-07-01, ERP巡检

早晨7点40出门,热气笼罩全身,第一次感受到九江如此“热情”。

巡检中发现一个大于100M的索引无法REBUILD,问题是所在的数据文件有坏块,查ALERT文件,发现2012年就有该问题。对客户算有个好的交待,后面先在测试环境实施解决方案,再应用到生产环境。


2013-07-02,SUN服务器磁盘掉落,硬件维护公司初步判断是断网造成。挂好磁盘陈列后,DB正常,可登陆生产环境。

注定了这次巡检有诸多的不顺,但想想是可以学到很多东西。

磁盘掉落的时候,正在删除系统中的测试环境。用户发现生产环境的目录文件都不见,第一反应怀疑我进行了误操作,各种解释,并给他检查我执行的命令。我是吓出一身冷汗。后来发现是磁盘陈列从目录结构中掉落。其实可以: df -h的。


2013-07-03,业务人员反应部分Form表单无法访问。开始重启AP层,关闭时,部分脚本exit status为2。包括:adapcctl.sh, adfrmctl.sh, adfrmsctl.sh。单独执行脚本也出现同样错误。尝试启动AP层,仍报错,提示Apache server already started。再关闭服务,会提示Apache server already stopped。Kill相关进程,系统会再创建出来新进程。以前没遇到这种问题。咨询了一个前同事徐斌老师,给了很中肯的方案。按如下步骤进行操作:

1)执行adstpall.sh 

2)adapcctl.sh status 

stopped , exit status 2

3)adfrmctl.sh status

stopped, exit status 2

4)adfrmsctl.sh status

stopped, exit status 2

判断AP已关闭。

5)关闭数据库层,数据库正常关闭,exit status 0。此时Kill Appache相关进程仍然会出现新进程。

6)重启SUN服务器。

关闭进行缓慢,有Warning,提示大家temprature limited 68 C。

好吧,猜测昨天的磁盘陈列掉落和温度相关。



原创粉丝点击