1.错误代码:B9735AF4

来源:互联网 发布:网游在线人数数据 编辑:程序博客网 时间:2024/06/10 20:19
解决办法:
这只是一个提示信息,并不是一个报错信息。


2012年6月份碰到的问题
1.最近遇到一个问题,每隔一段时间就会在aix系统里面报错如下:

[bit64__sop:/#]errpt -d H -T PERM
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
B9735AF4   0621150212 P H hdisk4         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0621150112 P H hdisk9         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0621150112 P H hdisk8         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0621150112 P H hdisk23        SUBSYSTEM COMPONENT FAILURE
B9735AF4   0621150112 P H hdisk7         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0621150012 P H hdisk6         SUBSYSTEM COMPONENT FAILURE
B9735AF4   0621150012 P H hdisk5         SUBSYSTEM COMPONENT FAILURE

2.报错详细信息如下

[bit64__sop:/#]errpt -aj B9735AF4|more
---------------------------------------------------------------------------
LABEL:          FCP_ARRAY_ERR6
IDENTIFIER:     B9735AF4
Date/Time:       Thu Jun 21 15:02:31 BEIST 2012
Sequence Number: 3505
Machine Id:      00070445D600
Node Id:         sop
Class:           H
Type:            PERM
Resource Name:   hdisk4
Resource Class:  disk
Resource Type:   array
Location:        U787B.001.DNWGBSY-P1-C2-T1-W200400A0B8565DED-L0
Description
SUBSYSTEM COMPONENT FAILURE
Probable Causes
ARRAY DASD MEDIA
POWER OR FAN COMPONENT
Failure Causes
ARRAY DASD MEDIA
POWER OR FAN COMPONENT
        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0A00 2A00 029C BD00 0000 0804 0000 0000 0000 0000 0001 EA11 0102 0000 7000 0600
0000 009E 0000 0000 3F03 0000 0000 0000 0100 0000 0000 0000 0000 0000 0000 0000
0008 5900 002A 0002 9CBD 0000 0008 0400 0000 0000 0000 0000 5347 3932 3530 3830
3836 2020 2020 2020 0750 1300 0000 0000 0900 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0005 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 1269 B417 3036 3231 3132 2F30 3030 3632 3600 0000 0000
0000 0000 1052 8000 F205 3704 0000 0200 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000
--------------------------------------------------------------------------

3.从报错信息看,有可能是存储的硬盘、电源或风扇有问题,但是sm登陆存储系统,各部件的状态都是optimal,没有损坏现象。存储系统(ds4700)完好。

4.看了与这个存储系统(ds4700)连接的另外两台主机,每隔一段时间在aix系统也报同样的错误。说明跟操作系统没有关系,报错信息源头是出在存储这块的。

5.看了MEL日志,6月21这一天也没有什么错误,只是一些事件的改变。

6.aix系统版本是5309、5310,ds4700微码版本是7.50.13,是09年的版本,比较新。

7.在网上查了一下相关信息,说是主机上面报出来的FCP_ARRAY_ERR6的报错,这只是表明 DS4000的状态有变化,不是真正的报错。

各位有谁碰到过这种情况的?这个情况应该是微码较新造成的?
 
 
现在来结帖
FCP_ARRAY_ERR6 (控制器微码是07.XX )
环境:控制器的微码是07.XX  
故障现象:
AIX 会不定期的报   FCP_ARRAY_ERR6 "SUBSYSTEM COMPONENT FAILURE" 。
分析DS4000的Event Log(MEL) ,发现DS4000有内部状态的变更,例如管理网口网线的插拔,
LUN Ownership 的切换,LUN的创建和删除,LUN Mapping 关系的创建和删除,甚至
“Description unknown” 等等。而且,AIX 报错的时间和DS4000 MEL提示变更的时间完全对不
上号,往往是变更发生过后一段时间AIX 才报错。
MEL:
09-9-17  4:05:18   756  5802  Info   0/0/0   Ctr: A  Management port link up
09-9-17  4:06:33   763  5023  Info   1/5a/0           RPC:
assignVolumeOwnership RC: OK
09-7-1  15:30:37   825  5802  Info   0/0/0           Description unknown

分析:
这个报错只是表明DS4000内部状态有变更,不能称之为“报错” ,不代表有硬件故障。这是
DS4000在微码07.XX 以上的新特性。由于AIX 只有在发起IO的时候,才会得知DS4000内部
状态的变更,所以这种“ 报错” 相比起DS4000内部状态的变更,往往会滞后一段时间。

解决办法:
这只是一个提示信息,并不是一个报错信息。
原创粉丝点击