生产环境的一次 gc cr multi block request 事件

来源：互联网发布：凸显网络编辑：程序博客网时间：2024/06/05 22:33

今天生产环境出现个头大的问题，一个平时只要二三十分钟的程序跑了六七个小时还没跑完，抓出sql，就是平时一个几分钟就能跑完的sql，在看看session，发现等待事件一直都是 gc cr multi block request 。

查了下关于这个等待事件的说明：

当一个进程访问需要一个或者多个块时，Oracle会首先检查自己的Cache是否存在该块，如果发现没有，就会先通过global cache赋予这些块共享访问的权限，然后再访问。假如，通过global cache发现这些块已经在另一个实例的Cache里面，那么这些块就会通过Cache Fusion，在节点之间直接传递，同时出现global cache crrequest等待事件。

所以我天真的以为，再等等再等等，等sql把需要的块传输过来就好了，结果又是两三个小时过去了，还是一直是这个等待事件，崩溃。。。。。

再去查查还有什么原因导致这种等待：

1. 存在热块的争用----好理解，你要用，我也要用，死活不给你

2. cpu负载过高----太忙了，没时间帮你传输数据

3. sql的全盘扫描情况严重-----这个也好理解，全盘扫描，需要的数据量就大，分散到另一节点的可能性就大，不过这里再慢也应该跑完

4. LMS(LOCK MANAGER SERVER PROCESS)进程不够，LMS就是负责从CPU获取资源的进程

到底是什么原因了？？？我也不知道，无能为力，只能指望DBA了，又过了几个小时，传来好消息，程序跑完了，一打听，原来是有个系统占用了大量的CPU资源，不止我们这一个系统跑不动。虽然对于高深的RAC还是不够了解，还是先把我学到的东西记录下来，知识的累积是需要一个过程的。