oracle rac 日志体系结构

来源:互联网 发布:投资有哪些种类知乎 编辑:程序博客网 时间:2024/06/07 20:59
告警日志
集群节点集群件告警日志:$GRID_HOME/log/<hostname>/alert<hostname>.log

数据库实例的告警日志:$DIAG_DESTINATION/rdbms/<dbname>/SID/trace/alert_<SID>.log

安装日志文件
root.sh配置脚本的调试日志:$GRID_HOME/cfgtoollogs/crsconfig/rootcrs_<hostname>.log

自动诊断仓库
自动诊断仓库位置由初始化参数diagnostic_dest指定,和操作系统环境变量$ORACLE_BASE一样。
如果diagnostic_dest和$ORACLE_BASE都未设置,则使用$ORACLE_HOME/log路径。

[sql] view plaincopyprint?
  1. SQL> select * from v$diag_info;  
  2.   
  3.    INST_ID NAME                           VALUE  
  4. ---------- ------------------------------ ------------------------------------------------------------  
  5.          2 Diag Enabled                   TRUE  
  6.          2 ADR Base                       /u01/app  
  7.          2 ADR Home                       /u01/app/diag/rdbms/orcl/orcl2  
  8.          2 Diag Trace                     /u01/app/diag/rdbms/orcl/orcl2/trace  
  9.          2 Diag Alert                     /u01/app/diag/rdbms/orcl/orcl2/alert  
  10.          2 Diag Incident                  /u01/app/diag/rdbms/orcl/orcl2/incident  
  11.          2 Diag Cdump                     /u01/app/diag/rdbms/orcl/orcl2/cdump  
  12.          2 Health Monitor                 /u01/app/diag/rdbms/orcl/orcl2/hm  
  13.          2 Default Trace File             /u01/app/diag/rdbms/orcl/orcl2/trace/orcl2_ora_15431.trc  
  14.          2 Active Problem Count           0  
  15.          2 Active Incident Count          0  
  16.   
  17. 已选择11行。  
cdump:这个目录包含核心转储
trace:这个目录转储数据库告警日志和前台及后台数据库进程的跟踪文件。
alert:这个目录存储XML告警日志。
hm:这个目录存储健康检查输出文件。
incident:这个目录存储由关键错误生成的事故目录,每个事故目录以该事故的ID进行命名。
metadata:这个目录包含诊断元数据。

oracle gridinfrastructure日志目录结构
$GRID_HOME/log 这是每个集群节点上为oracle集群件以及ASM存储跟踪和诊断日志文件的主目录。
$GRID_HOME/log/<hostname> 仅包含本地节点oracle集群件和ASM的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/agent 包含CRSDOHASD守护进程的跟踪和诊断日志文件。

$GRID_HOME/log/<hostname>/crsd 包含CRSD守护进程的跟踪和调试日志。

$GRID_HOME/log/<hostname>/ohasd 包含高可用性守护进程的跟踪和调试日志。

$GRID_HOME/log/<hostname>/cssd 包含CSS日志,其中包括来自客户端CSS侦听器的操作。
$GRID_HOME/log/<hostname>/diskmon 包含用于排除磁盘监控器守护进程故障的跟踪和调试日志。
$GRID_HOME/log/<hostname>/gipcd 包含用于排除oracle网格进程间通信守护进程的跟踪和调试日志。

$GRID_HOME/log/<hostname>/gnsd 包含用户排除oracle网格命令服务相关问题的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/crflogd 包含由oracle集群健康监控器提供的集群记录服务器服务记录的跟踪和调试日志.

$GRID_HOME/log/<hostname>/ctssd 包含用户排除集群时间同步服务故障的跟踪和调试日志。
$GRID_HOME/log/<hostname>/client 包含各种oracle gridinfrastructure客户端的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/crfmond 包含由oracle集群健康监控器提供的系统监控服务记录的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/cvu 包含由oracle集群验证实用工具生成的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/evmd 包含EVM守护进程的跟踪和诊断日志文件。

$GRID_HOME/log/<hostname>/mdnsd 包含用于排除多播域名服务故障的跟踪和诊断日志文件。
$GRID_HOME/log/<hostname>/racg 包含各个oracle racg可执行文件的跟踪和调试日志。。
$GRID_HOME/log/<hostname>/gpnpd 包含网格即插即用守护进程的跟踪和调试日志。

CRSD进程

10g RAC, CRSD是RAC中最关键的进程之一,Oracle在操作系统启动后,就是通过启动这个进程然后启动整个CLUSTER以及数据库的。

在11.2的RAC中,Oracle调整了ASM,使得OCR和VOT可以存储在ASM磁盘组中。ASM是CLUSTER所支持的一个组件,而CLUSTER启动所需的OCR和VOT却要放在ASM中,这其实要解决一个先有鸡还是先有蛋的问题。最终Oracle通过OHASD进程的方式解决了这个问题,而整个CLUSTER和ASM的架构也发生了重大的变化,OHASD进程取代了CRSD进程变成了RAC环境中最关键的进程。

而CRSD进程的重要性已经低到难以置信的地步, 11.2 RAC环境中发现,即使一个节点的CRSD进程没有启动,仍然可以手工启动数据库,且数据库可以正常访问。

导致的问题原因应该是节点2上访问OCR和VOT所在的磁盘组出现了错误,导致CRSD在多次尝试获取OCR中存储的信息失败后自动退出,从而使得节点2无法正常的启动。不过这时节点2上除了CRSD进程外,其他的CLUSTER进程已经完全启动,ASM实例也可以启动,这时可以手工启动节点2上的数据库。

CRSD是实现"高可用性(HA)"的主要进程,它提供的服务叫作CRS(Cluster Ready Service) 服务。所有需要 高可用性 的组件,都会在安装配置的时候,以CRS Resource的形式登记到OCR中,而CRSD 进程就是根据OCR中的内容,决定监控哪些进程,如何监控,出现问题时又如何解决。也就是说,CRSD 进程负责监控CRS Resource 的运行状态,并要启动,停止,监控,Failover这些资源。 默认情况下,CRS 会自动尝试重启资源5次,如果还是失败,则放弃尝试。

CRS Resource 包括GSD(Global Serveice Daemon),ONS(Oracle Notification Service),VIP, Database, Instance 和Service.

OHASD进程

Oracle High Availability Services Daemon (OHASD) :This process anchors the lower part of the Oracle Clusterware stack, which consists of processes that facilitate cluster operations.

在11gR2里面启动CRS的时候,会提示ohasd已经启动。 那么这个OHASD到底包含哪些资源。 我们可以通过如下命令来查看.

crsctl stat res -init -t

OCSSD进程

OCSSD :这个进程是Clusterware最关键的进程,如果这个进程出现异常,会导致系统重启,这个进程提供CSS(Cluster Synchronization Service)服务。 CSS 服务通过多种心跳机制实时监控集群状态,提供脑裂保护等基础集群服务功能。

EVMD进程

负责发布CRS 产生的各种事件(Event). 这些Event可以通过2种方式发布给客户:ONS 和 Callout Script.




0 0
原创粉丝点击