Oracle 10.2.0.4 高负载 触发 ORA-00494 错误

来源:互联网 发布:java教程 菜鸟教程下载 编辑:程序博客网 时间:2024/06/06 02:21

MOS 上有一篇文章专门介绍这个问题,参考:[ID 779552.1]。

 

在Oracle 10.2.0.4版本中,alert log 可能出现如下错误:

       ORA-00494:enqueue [CF] held for too long (more than 900 seconds)

 

       这个错误,通常和ORA-600 [2103] 一起出现。 他们的产生的原因都是一样的。进程在指定时间内(默认900秒)不能获取CF  队列。

 

       一般只在系统高负载,高并发,IO 等待和争夺时,Oracle进程占有相关资源没有释放造成。

 

有2个bug 可能导致这个问题:

       (1)Bug7692631 - 'DATABASE CRASHES WITH ORA-494 AFTER UPGRADE TO 10.2.0.4'

       (2)unpublished Bug 7914003 'KILL BLOCKER AFTER ORA-494 LEADS TO FATALBG PROCESS BEING KILLED'

 

解决方法:

       在10.2.0.4 的Oracle 的机制中会kill 所有block的进程,包括后台进程和非后台进程。 要注意的是:

(1)    如果是非后台进程holder 了CF enqueue,那么kill 该进程,那么实例还可以正常运行。

(2)如果是后台进程,如LGWR holder了,那么kill LGWR 将会导致db crash。

 

为了避免kill 掉blocker 进程(后台和非后台进程),可以设置参数:

       _kill_controlfile_enqueue_blocker=false.

 

       这样所有blocker 进程都不会被kill 掉。即使该进程hold 了enqueue 很长时间。一般来说,最好的情况是避免kill 后台进程,允许kill 非后台进程。

 

       为了阻止后台进程被kill,可以在init.ora  文件里设置参数:_kill_enqueue_blocker=1,该参数默认值为3.

 

       当设置该参数之后,如果enqueue 被后台进程holder,该后台进程不会给kill。 所以实例不会crash。 如果enqueue被非后台进程holder,那么10.2.0.4 的机制还是会尝试去kill 非后台进程。

 

       Oracle保留ORA-494 的原因是用户更倾向于instance crash,如果不crash,db 就会hang住。   

 

 

 

 

 

-------------------------------------------------------------------------------------------------------

原创粉丝点击