生产环境的一次 gc cr multi block request 事件

来源:互联网 发布:凸显网络 编辑:程序博客网 时间:2024/06/05 22:33

今天生产环境出现个头大的问题,一个平时只要二三十分钟的程序跑了六七个小时还没跑完,抓出sql,就是平时一个几分钟就能跑完的sql,在看看session,发现等待事件一直都是 gc cr multi block request 。

查了下关于这个等待事件的说明:

当一个进程访问需要一个或者多个块时,Oracle会首先检查自己的Cache是否存在该块,如果发现没有,就会先通过global cache赋予这些块共享访问的权限,然后再访问。假如,通过global cache发现这些块已经在另一个实例的Cache里面,那么这些块就会通过Cache Fusion,在节点之间直接传递,同时出现global cache crrequest等待事件。

所以我天真的以为,再等等再等等,等sql把需要的块传输过来就好了,结果又是两三个小时过去了,还是一直是这个等待事件,崩溃。。。。。

再去查查还有什么原因导致这种等待:

1. 存在热块的争用----好理解,你要用,我也要用,死活不给你

2. cpu负载过高----太忙了,没时间帮你传输数据

3. sql的全盘扫描情况严重-----这个也好理解,全盘扫描,需要的数据量就大,分散到另一节点的可能性就大,不过这里再慢也应该跑完

4. LMS(LOCK MANAGER SERVER PROCESS)进程不够,LMS就是负责从CPU获取资源的进程

到底是什么原因了???我也不知道,无能为力,只能指望DBA了,又过了几个小时,传来好消息,程序跑完了,一打听,原来是有个系统占用了大量的CPU资源,不止我们这一个系统跑不动。虽然对于高深的RAC还是不够了解,还是先把我学到的东西记录下来,知识的累积是需要一个过程的。