DBA工作备忘录-阵列损坏解决方法

来源：互联网发布：算命软件编辑：程序博客网时间：2024/05/21 19:41

问题描述：
下午现场人员说产品库意外中止，紧接着说可能是阵列损坏，因为灯都不亮了。
于是紧急拨号到远程，检查，5分钟以后，数据库重新启动成功。
问题其实非常简单，但是后来看alertlog，发现从阵列失效一直到给我打电话，中间有将近1个小时的时间，这段时间里面，因为现场人员不知道问题所在，所以反复切换cluster，试图让数据库能够启动成功，汗！

问题解释：
产品库中控制文件总共三份，分别保存在/global/oracle,/global/backup1,/global/backup2
下。重作日志和归档日志各两份，分别保存在/global/backup1,/global/backup2
下。
/global/oracle,/global/backup1,/global/backup2是三个独立的阵列。
由于控制文件对于oracle必须保持一致，所以三份控制文件中的任何一份无法读取
，数据库都会关闭。而重作日志和归档日志，只要有一份可以正常读写，那么数据
库还可以继续正常运行。
所以，如果任何一个阵列失效，那么由于控制文件的问题，数据库都会意外中止。

解决流程：
1。数据库意外中止

2。检查$ORACLE_HOME/admin/dpshdb/bdump/alert_dpshdb.log文件，确认意外中
止的原因，比如今天的内容是：
TueOct2616:36:402004
Errorsinfile/export/oracle/product/817/admin/dpshdb/bdump/dpshdb_ckpt_16541.trc:
ORA-00206:errorinwriting(block3,#blocks1)ofcontrolfile
ORA-00202:controlfile:'/global/backup1/oradata/dpshdb/control02.ctl'
ORA-27063:skgfospo:numberofbytesread/writtenisincorrect
SVR4Error:6:Nosuchdeviceoraddress
Additionalinformation:-1
Additionalinformation:8192
TueOct2616:36:402004
Errorsinfile/export/oracle/product/817/admin/dpshdb/bdump/dpshdb_lgwr_16539.trc:
ORA-00345:redologwriteerrorblock38713count2
ORA-00312:onlinelog1thread1:'/global/backup1/oradata/dpshdb/redo1b.log'
ORA-27063:skgfospo:numberofbytesread/writtenisincorrect
SVR4Error:5:I/Oerror
Additionalinformation:-1
Additionalinformation:1024
第一部分是指出control02.ctl控制文件无法读取，第二部分是指出redo1b.log重
作日志无法读取。
然后数据库自动关闭，如下显示，是16:36:43发生的，也就是在16:36:40首次发现
阵列失效的3秒以后（我们知道CKPT的timeout值是3秒）：
TueOct2616:36:432004
Errorsinfile/export/oracle/product/817/admin/dpshdb/udump/dpshdb_ora_10206.trc:
ORA-00221:写入控制文件出错
InstanceterminatedbyCKPT,pid=16541
从这些log中我们可以知道/global/backup1阵列失效了。

3。修改初始化参数文件$ORACLE_HOME/dbs/initdpshdb.ora，忽略失效的控制文件
和失效的归档路径
原内容：
control_files=("/global/oracle/oradata/dpshdb/control01.ctl",
"/global/backup1/oradata/dpshdb/control02.ctl",
"/global/backup2/oradata/dpshdb/control03.ctl")
log_archive_dest_1="location=/global/backup1/oradata/dpshdb/arch"
修改后的内容：
control_files=("/global/oracle/oradata/dpshdb/control01.ctl",
"/global/backup2/oradata/dpshdb/control03.ctl")
#log_archive_dest_1="location=/global/backup1/oradata/dpshdb/arch"

4。启动数据库，此时数据库已经可以正常使用了。

5。为了保证重作日志文件始终保持2份，所以在数据库启动以后，我们需要删除掉
原来失效的文件，添加新的重作日志文件。这部分操作可以在数据库启动以后再作
，但是最好不要有大量的更新操作，是为了防止重作日志切换过快，导致删除重作
日志的操作失败。
alterdatabasedroplogfilemember
'/global/backup1/oradata/dpshdb/redo1b.log';1
<script type="text/javascript"></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>