<原创>如何看机械硬盘SMART信息

来源:互联网 发布:python延时2秒 编辑:程序博客网 时间:2024/04/29 05:05
本帖最后由 neeyuese 于 2010-4-2 22:09 编辑

S.M.A.R.T,全称叫Self-Monitoring, Analysis, and Reporting Technology "自我监测,分析和报告技术"。可以用来预测分析硬盘的潜在问题。

说道硬盘故障,分为忽然性和渐进性2种:

前面种很难防止,没有任何迹象,比如芯片烧了,硬盘摔了或者人品不好之类的。要防止只有多做备份了。
渐进性的故障是随着时间慢慢发生的,比如声音出现异常,可能是主轴马达磨损,硬盘逐渐老化出现读取困难等。

对于渐进性的故障,我们可以靠着SMART数据发现点有用的信息。

SMART状态表由下面几个参数构成:



ID,点上去后下面会显示DESCRIPTION(属性描述)
由于硬盘厂很多,很多厂家属性的名字也不尽相同,或者某些厂牌缺少某些属性,所以一般我们以ID来区别比较简单。

THRESHOLD(阈值)、CURRENT(当前值)和WORST(最坏值)
当前值低于最坏值时候,硬盘处于警告状态,SMART像系统报告,这时候应该记得备份数据。一般当前值是不可能降低到最坏值的(西数,希捷某些属性除外)。

DATA(数据), STATUS(状态)
DATA里有更详细的数据,由各家厂自定义。状态表现为健康和警告,错误。

根据S.M.A.R.T属性对硬盘故障预测的重要性不同,分为关键属性(Critical Attributes)和资料属性(Informative  attributes)。

关键属性:对硬盘的使用寿命、各机械组件的渐进性故障具有一定的监测作用。
资料属性:反馈硬盘的相关运行记录供参考。

那么那些是关键属性哪?一般我们说THRESHOLD(阈值)不是0的属性是关键属性。
或者还有更简单的一个方法,用Everest看硬盘SMART信息,后面状态栏写:


图中 O.K. Always Passes的就是资料属性。 O.K. Value is normal的就是关键属性。

一般同一型号的硬盘SMART个数是相同的,但是同一硬盘厂不同时期出的硬盘SMART个数是不同的。

虽然关键属性因品牌不同有差别,但有一项属性是所有品牌都有的。这就是05项Reallocated Sectors Count,它的作用是记录重映射扇区个数。硬盘都具备一定的修复功能,当出现不稳定的扇区,硬盘Firmware里的程序会把不稳定扇区的数据转移到同样容量的备用扇区里面,并屏蔽掉不稳定扇区,实现坏道替换。这种硬盘底层的操作在操作系统里不留痕 迹,他会在S.M.A.R.T属性的05项做下记录。05项的当前值显示备用扇区的多少。新盘出厂时,备用扇区最多,随着使用中坏扇区的出现,备用扇区的减少,当前值逐渐降低, 各品牌的硬盘备用扇区数量是不同的, 05项阈值(THRESHOLD)控制上也不一样。希捷硬 盘的阈值是36,西数硬盘的阈值是140。

相对关键属性来说,资料属性的作用不是太大,但是也可以通过资料属性发现一些问题,要注意关键属性重点看当前值,而资料属性重点在于数据值。例如硬盘加电次数可以通过 0C项Power Cycle Count的数据值来得知;非正常断电次数可以通过C0项Power-Off Retract Count的Data数据值来得知;硬盘的温度由C2项Temperature项的数据数值来判断。

几个关键属性介绍:

01  Read Error Rate
显示当读取硬盘的时候,出现的硬件读取出错率。由于这个数值每家公司不同,所以不好定义。

05  Reallocated sectors count
显示当前有多少瑕疵的扇区被发现并重映射到了备用扇区。RAW数值显示的一般就是被重映射的扇区数。

0A  Spin Retry Count
硬盘转动重试计数,这个参数指的是硬盘第一次没转动,然后再次转动的次数,一般来这个数字如果有升高的迹象,说明硬盘有机械故障,当然不排除供电原因。

B8  End-to-End error
这个数字说的是传输数据的时候,缓存里的数据和主控、硬盘无法相对应。

BC  Command Timeout
硬盘工作中出现超时。一般是电源或者数据线问题。默认值是0

C4  Reallocation Event Count
计算重映射操作数。这个数字记录了重映瑕疵射扇区到备用扇区的总数,包括了成功和未成功的总数。

C5  Current pending sectors count
显示当前有多少被怀疑瑕疵的扇区被发现等待重新off-line验证,如果验证不通过就会进入重映射扇区。RAW数值显示的一般就是被怀疑瑕疵的扇区数。所谓的off-line验证是指硬盘在闲置的时候,内部做的验证做的验证程序。

C6  Uncorrectable Sector Count
显示无法修复的错误扇区总数,说明硬盘碟片或机械结构有问题。在富士通硬盘里显示为Off-Line Scan Uncorrectable Sector Count

C9  Soft Read Error Rate
读取中偏离磁道的错误计数

资料属性介绍:

03  Spin-Up Time 
硬盘从0转到完全操作的平均时间,Data里数字单位ms

BF  G-sense error rate
希捷2.5英寸硬盘特有的数值,表示受到外部震动或者使用环境造成的数据错误。

C7  UltraDMA CRC Error Count
这个参数亮黄时候记得换数据线,表示的是数据传输时候验证出错。
原创粉丝点击