来自Digoal的HP MSA2000 case

来源:互联网 发布:青少年必知的法律常识 编辑:程序博客网 时间:2024/05/16 05:34
今天一个HP MSA2312FC的存储发送了离奇的事情,多个VD上的多个磁盘状态变成了LEFTOVER。 
造成的结果是多个VD变成QTOF状态如下 : 
# show vd
Name Size     Free    Own Pref   RAID   Disks Spr Chk  Status Jobs      
  Serial Number                    
------------------------------------------------------------------------
vd01 3996.7GB 751.5MB A   A      RAID5  5     0   64k  QTOF             
  00c0ff10386b0000b519384c00000000 
vd02 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000dd19384c00000000 
vd03 3996.7GB 751.5MB A   A      RAID5  5     0   64k  FTOL             
  00c0ff10386b0000f919384c00000000 
vd04 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b100002d1a384c00000000 
vd05 3996.7GB 751.5MB A   A      RAID5  5     0   64k  QTOF             
  00c0ff10386b0000c19f554e00000000 
vd06 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000ce9f554e00000000 
vd07 3996.7GB 751.5MB A   A      RAID5  5     0   64k  QTOF             
  00c0ff10386b0000da9f554e00000000 
vd08 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000fc9f554e00000000 
------------------------------------------------------------------------
在执行rescan之后,多个磁盘被找回,VD恢复FTOL。但是vd01上面还是有4块盘是leftover的状态。
根据HP工程师的指导,关闭所有的登录MSA2312FC的WEB页面。然后通过命令行连接到这台msa2312fc。
执行
# trust enable
# trust vdisk vd01
报错
Error: Command failed. (vd01) - Vdisk is not online or fault tolerant. Cannot be trusted.

这下搞得比较崩溃了,HP对CASE做了升级。
新的解决方案出来了。先去WEB页面解除VD01的隔离。如下。
CASE : MSA2312fc MULTIDISKs LEFTOVER at the same time - 德哥@Digoal - The Heart,The World.
右键点击vd01,选择Tools -> Dequarantine Vdisk
按照指示解除vd01的隔离。
然后去命令行看vd01的状态会变成OFFL
# show vd                                                   
Name Size     Free    Own Pref   RAID   Disks Spr Chk  Status Jobs      
  Serial Number                    
------------------------------------------------------------------------
vd01 3996.7GB 751.5MB A   A      RAID5  5     0   64k  OFFL             
  00c0ff10386b0000b519384c00000000 
vd02 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000dd19384c00000000 
vd03 3996.7GB 751.5MB A   A      RAID5  5     0   64k  FTOL             
  00c0ff10386b0000f919384c00000000 
vd04 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b100002d1a384c00000000 
vd05 3996.7GB 751.5MB A   A      RAID5  5     0   64k  FTOL   VRSC 56%  
  00c0ff10386b0000c19f554e00000000 
vd06 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000ce9f554e00000000 
vd07 3996.7GB 751.5MB A   A      RAID5  5     0   64k  FTOL   VRSC 59%  
  00c0ff10386b0000da9f554e00000000 
vd08 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000fc9f554e00000000 
------------------------------------------------------------------------
然后再到命令行执行
# trust vdisk vd01
VD恢复为FTOL状态。
# show vd         
Name Size     Free    Own Pref   RAID   Disks Spr Chk  Status Jobs      
  Serial Number                    
------------------------------------------------------------------------
vd01 3996.7GB 751.5MB A   A      RAID5  5     0   64k  FTOL             
  00c0ff10386b0000b519384c00000000 
vd02 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000dd19384c00000000 
vd03 3996.7GB 751.5MB A   A      RAID5  5     0   64k  FTOL             
  00c0ff10386b0000f919384c00000000 
vd04 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b100002d1a384c00000000 
vd05 3996.7GB 751.5MB A   A      RAID5  5     0   64k  FTOL   VRSC 56%  
  00c0ff10386b0000c19f554e00000000 
vd06 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000ce9f554e00000000 
vd07 3996.7GB 751.5MB A   A      RAID5  5     0   64k  FTOL   VRSC 59%  
  00c0ff10386b0000da9f554e00000000 
vd08 3996.7GB 751.5MB B   B      RAID5  5     0   64k  FTOL             
  00c0ff1035b10000fc9f554e00000000 
------------------------------------------------------------------------
 
据HP称,这样操作可能导致部分数据丢失,可能指CACHE的脏数据。
另外HP建议观察几天,没有问题的话升级一下固件。