《数据恢复技术深度揭秘》读书笔记

来源:互联网 发布:阿里云 个人备案 编辑:程序博客网 时间:2024/04/20 16:25

《数据恢复技术深度揭秘》读书笔记

1、raid级别

raid 级 raid-0 raid-1 raid-3 raid-5 raid-10 raid-30 raid-50 别名 条带 镜像 专用奇偶位条带 分布式奇偶位条带 镜像阵列条带 专用奇偶阵列条带 分布式奇偶位条带 容错性 没有 有 有 有 有 有 有 冗余类型 没有 复制 奇偶位 奇偶位 复制 奇偶位 奇偶位 热备盘选项 没有 有 有 有 有 有 有 需要的硬盘数 至少两个 只需2个 3个或更多 3个或更多 至少4个 6、8、10、12、14、16 6、8、10、12、14、16 可用容量 磁盘总容量 磁盘总容量的50% (N-1)/N的磁盘容量 N-1)/N的磁盘容量 磁盘总容量的50% (N-2)/N的磁盘容量 (N-2)/N的磁盘容量

raid0数据分布图
这里写图片描述
raid1数据分布图
这里写图片描述
raid5数据分布图
这里写图片描述

2、raid的条带大小、盘序、校验方向、数据走向

盘序:多块物理盘在创建raid时,配置程序会把物理盘安排一个顺序。
条带:在raid创建过程中,配置程序把每块物理盘分割为一个一个单元,大小为2的n次方,这个单元就是条带,是raid处理数据的基本单位。
raid5的存储结构:
(1)左异步

1号盘 2号盘 3号盘 1 2 P1 3 P2 4 P3 5 6 7 8 P1 9 P2 10 P3 11 12

(2)左同步

1号盘 2号盘 3号盘 1 2 P1 4 P2 3 P3 5 6 7 8 P1 10 P2 9 P3 11 12

(3)右异步

1号盘 2号盘 3号盘 P1 1 2 3 P2 4 5 6 P3 P1 7 8 9 P2 10 11 12 P3

(4)右同步

1号盘 2号盘 3号盘 P1 1 2 4 P2 3 5 6 P3 P1 7 8 10 P2 9 11 12 P3

(5)HP双循环

3、软raid和硬raid

4、raid的写惩罚

介绍


 通常在讨论不同RAID保护类型的性能的时候,结论都会是RAID-1提供比较好的读写性能,RAID-5读性能不错,但是写入性能就不如RAID-1,RAID-6保护级别更高,但写性能相对更加差,RAID10是提供最好的性能和数据保护,不过成本最高等等。其实决定这些性能考虑的因素很简单,它就是RAID Write Penalty(写惩罚)。本文从原理上解释了不同RAID保护级别的写惩罚,以及通过写惩罚计算可用IOPS的方法。

更多信息


RAID-5 Write Penalty的例子:

 存储方案规划的过程中,最基本的考虑因素有两个,性能和容量。性能上的计算看可以分为IOPS和带宽需求。计算IOPS,抛开存储阵列的缓存和前端口不谈。计算后端物理磁盘的IOPS不能简单的把物理磁盘的最大IOPS相加而获得。原因是,对于不同的RAID级别,为了保证当有物理磁盘损坏的情况下可以恢复数据,数据写入的过程中都需要有一些特别的计算。比如对于RAID-5,条带上的任意磁盘上的数据改变,都会重新计算校验位。如下图所示,一个7+1的RAID-5的条带中,七个磁盘存储数据,最后一个磁盘存储校验位。

这里写图片描述

 对于一个数据的写入,我们假设在第五个磁盘上写入的数据为1111,如下图所示。那么整个RAID-5需要完成写入的过程分为以下几步:

这里写图片描述

读取原数据0110,然后与新的数据1111做XOR操作: 0110 XOR 1111 = 1001
读取原有的校验位0010
用第一步算出的数值与原校验位再做一次XOR操作: 0010 XOR 1001 = 1011
然后将1111新数据写入到数据磁盘,将第三步计算出来的新的校验位写入校验盘。

 由上述几个步骤可见,对于任何一次写入,在存储端,需要分别进行两次读+两次写,所以说RAID-5的Write Penalty的值是4。

不同RAID级别的Write Penalty:

下表列出了各种RAID级别的Write Penalty值:

RAID Write Penalty 0 1 1 2 5 4 6 6 10 2

RAID-0:直接的条带,数据每次写入对应物理磁盘上的一次写入
RAID-1和10:RAID-1 和RAID-10的写惩罚很简单理解,因为数据的镜像存在的,所以一次写入会有两次。
RAID-5:RAID-5由于要计算校验位的机制存在,需要读数据、读校验位、写数据、写校验位四个步骤,所以RAID-5的写惩罚值是4。
RAID-6:RAID-6由于有两个校验位的存在,与RAID-5相比,需要读取两次校验位和写入两次校验位,所以RAID-6的写惩罚值是6。

计算IOPS:

 根据上文的描述,在实际存储方案设计的过程中,计算实际可用IOPS的过程中必须纳入RAID的写惩罚计算。计算的公式如下:

物理磁盘总的IOPS = 物理磁盘的IOPS × 磁盘数目

可用的IOPS = (物理磁盘总的IOPS × 写百分比 ÷ RAID写惩罚) + (物理磁盘总的IOPS × 读百分比)

 假设组成RAID-5的物理磁盘总共可以提供500 IOPS,使用该存储的应用程序读写比例是50%/50%,那么对于前端主机而言,实际可用的IOPS是:

(500 ×50% ÷ 4)+ ( 500 * 50%) = 312.5 IOPS

2、磁盘的平均访问时间

介绍


 磁盘是主要的物理存储设备,机械硬盘的性能受其转速(RPM),寻道时间(Seek Time)以及旋转延迟(Rotational latency)的影响,本文将描述如何通过这些参数计算磁盘的性能。

更多信息


磁盘规格

机械硬盘的性能指标有三个重要的参数:

寻道时间 – 在磁道之间移动磁头所花费的时间
旋转延迟 – 盘片将数据旋转至磁头下的时间
传输速率 – 磁盘的带宽

 理解这些参数之间的关系有助于了解一块磁盘的性能,这些值在决定磁盘性能的两个基本度量的时候非常有用:吞吐量和响应时间

寻道时间

 寻道时间以毫秒(ms)来计算,不同磁盘的寻道时间不同。平均寻道时间是经常使用的度量,对于一块15k rpm的3.5英寸SAS盘,其平均寻道时间是3.8ms。减少磁盘寻道所花费的时间能增强性能。i/o类型也会影响寻道时间,连续i/o拥有最少的寻道时间,因为读写头可以在盘片上连续操作,而随机i/o就相对有较长的寻道时间,因为磁头始终需要在不同的磁道间切换。

延迟

延迟以毫秒(ms)来计算,更高转速的磁盘其延迟更小。下表显示了不同转速的磁盘所对应的延迟:
这里写图片描述

传输速率

 传输速率以MB/s来计算,它又可以进一步分为内部/外部速率。内部速率是指在盘片上读写数据的快慢,盘片外圈速率要高于盘片里圈,而且对于同样的线性距离,也拥有更多的扇区。比如对于一个使用连续带宽的应用,3.5-inch 15k rpm SAS磁盘可以提供50MB/s的内圈速率以及100MB/s的外圈速率。

外部传输速率是指磁盘的连线头到HBA或NIC的传输速率。厂商通常给出的都是突发速率,且假定是内部连接(DAS)。对于存储系统来说,比如VNX,同一个RAID组内的磁盘是共享后端此部分速率的,因此通常达不到厂商给出的突发速率。存储系统的总线架构,实际传输速率更多是由后端传输协议、仲裁时间以及后端端口容量来决定的。

计算平均响应时间

 平均响应时间是指一个请求从排队开始一直到执行结束所花费的时间,计算公式为:响应时间 = (队列长度+1)*平均响应时间

比如,某块磁盘的平均响应时间为6ms,队列长度为6,那么响应时间 = 42ms = (6+1)*6 ms

0 0
原创粉丝点击