独立冗余磁盘阵列RAID的作用？RAID0和RAID1的区别

来源：互联网发布：儿童手机画画软件编辑：程序博客网时间：2024/04/29 09:20

上系统结构课时，老师特意讲了一下RAID，于是知道独立冗余磁盘阵列（Redundent Array of Independent Disk）用于数据备份。

RAID0和RAID1的区别是数据放置的方式不同。都是在各块磁盘中顺序存放，

假设有12345678几个数据，独立冗余磁盘阵列由4块磁盘组成，

RAID0中的数据是按照1234（分别对应于4个磁盘） 5678（分别对应于4个磁盘）的顺序并行存放的，这样访问的速度很高，缺点是没有冗余。

而RAID1是按照1122（分别对应于4个磁盘）， 3344（分别对应于4个磁盘），5566（分别对应于4个磁盘），7788（分别对应于4个磁盘）的顺序存放的，这样起到冗余的作用，其中一块磁盘坏了，也不会影响到数据的存储，但是这样浪费了一半的磁盘空间。

而RAID5则结合了以上两种方法的优点，存放数据的方法是123p（分别对应于4个磁盘），456p（分别对应于4个磁盘），p78*（分别对应于4个磁盘），其中p是校验位，是使用xor算法计算的，当任意一块磁盘损坏后，仍然可以通过算法对磁盘进行重组，从而起到备份的作用。这样，用于备份的磁盘数只是一个，大大节省了磁盘空间。

------------------------------------------------------------------------------------------------------------------------------------------------

以上只是听老师说后总结下来的，接下来的是网上搜集的补充资料：

利用N台硬盘通过RAID controller（including hardware and software）组合虚拟成单台大容量的硬盘使用，特色是N台硬盘同时读取使访问速度加快，且提高容错性（fault tolerant），所以当成平时主要访问数据的存取速度问题而不是备份问题。

（2）RAID的工作原理

　　RAID如何实现数据存储的高稳定性呢？我们不妨来看一下它的工作原理。RAID按照实现原理的不同分为不同的级别，不同的级别之间工作模式是有区别的。整个的RAID结构是一些磁盘结构，通过对磁盘进行组合达到提高效率，减少错误的目的，不要因为这么多名词而被吓坏了，它们的原理实际上十分简单。为了便于说明，下面示意图中的每个方块代表一个磁盘，竖的叫块或磁盘阵列，横称之为带区。

　　（3）RAID规范

　　主要包含RAID 0～RAID 7等数个规范，它们的侧重点各不相同，常见的规范有如下几种：

　　RAID 0：无差错控制的带区组

　　要实现RAID0必须要有两个以上硬盘驱动器，RAID0实现了带区组，数据并不是保存在一个硬盘上，而是分成数据块保存在不同驱动器上。因为将数据分布在不同驱动器上，所以数据吞吐率大大提高，驱动器的负载也比较平衡。如果刚好所需要的数据在不同的驱动器上效率最好。它不需要计算校验码，实现容易。它的缺点是它没有数据差错控制，如果一个驱动器中的数据发生错误，即使其它盘上的数据正确也无济于事了。不应该将它用于对数据稳定性要求高的场合。如果用户进行图象（包括动画）编辑和其它要求传输比较大的场合使用RAID0比较合适。同时，RAID可以提高数据传输速率，比如所需读取的文件分布在两个硬盘上，这两个硬盘可以同时读取。那么原来读取同样文件的时间被缩短为1/2。在所有的级别中，RAID 0的速度是最快的。但是RAID 0没有冗余功能的，如果一个磁盘（物理）损坏，则所有的数据都无法使用。

　　RAID 1：镜象结构

对于使用这种RAID1结构的设备来说，RAID控制器必须能够同时对两个盘进行读操作和对两个镜象盘进行写操作。通过下面的结构图您也可以看到必须有两个驱动器。因为是镜象结构在一组盘出现问题时，可以使用镜象，提高系统的容错能力。它比较容易设计和实现。每读一次盘只能读出一块数据，也就是说数据块传送速率与单独的盘的读取速率相同。因为RAID1的校验十分完备，因此对系统的处理能力有很大的影响，通常的RAID功能由软件实现，而这样的实现方法在服务器负载比较重的时候会大大影响服务器效率。当您的系统需要极高的可靠性时，如进行数据统计，那么使用RAID1比较合适。而且RAID1技术支持“热替换”，即不断电的情况下对故障磁盘进行更换，更换完毕只要从镜像盘上恢复数据即可。当主硬盘损坏时，镜像硬盘就可以代替主硬盘工作。镜像硬盘相当于一个备份盘，可想而知，这种硬盘模式的安全性是非常高的，RAID 1的数据安全性在所有的RAID级别上来说是最好的。但是其磁盘的利用率却只有50%，是所有RAID级别中最低的。

　　RAID2：带海明码校验

　　从概念上讲，RAID 2 同RAID 3类似，两者都是将数据条块化分布于不同的硬盘上，条块单位为位或字节。然而RAID 2 使用一定的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查及恢复信息，使得RAID 2技术实施更复杂。因此，在商业环境中很少使用。下图左边的各个磁盘上是数据的各个位，由一个数据不同的位运算得到的海明校验码可以保存另一组磁盘上，具体情况请见下图。由于海明码的特点，它可以在数据发生错误的情况下将错误校正，以保证输出的正确。它的数据传送速率相当高，如果希望达到比较理想的速度，那最好提高保存校验码ECC码的硬盘，对于控制器的设计来说，它又比RAID3，4或5要简单。没有免费的午餐，这里也一样，要利用海明码，必须要付出数据冗余的代价。输出数据的速率与驱动器组中速度最慢的相等。

　　RAID3：带奇偶校验码的并行传送

这种校验码与RAID2不同，只能查错不能纠错。它访问数据时一次处理一个带区，这样可以提高读取和写入速度,它像RAID 0一样以并行的方式来存放数，但速度没有RAID 0快。校验码在写入数据时产生并保存在另一个磁盘上。需要实现时用户必须要有三个以上的驱动器，写入速率与读出速率都很高，因为校验位比较少，因此计算时间相对而言比较少。用软件实现RAID控制将是十分困难的，控制器的实现也不是很容易。它主要用于图形（包括动画）等要求吞吐率比较高的场合。不同于RAID 2，RAID 3使用单块磁盘存放奇偶校验信息。如果一块磁盘失效，奇偶盘及其他数据盘可以重新产生数据。如果奇偶盘失效，则不影响数据使用。RAID 3对于大量的连续数据可提供很好的传输率，但对于随机数据，奇偶盘会成为写操作的瓶颈。利用单独的校验盘来保护数据虽然没有镜像的安全性高，但是硬盘利用率得到了很大的提高，为n-1。

　　RAID4：带奇偶校验码的独立磁盘结构

RAID4和RAID3很象，不同的是，它对数据的访问是按数据块进行的，也就是按磁盘进行的，每次是一个盘。在图上可以这么看，RAID3是一次一横条，而RAID4一次一竖条。它的特点的RAID3也挺象，不过在失败恢复时，它的难度可要比RAID3大得多了，控制器的设计难度也要大许多，而且访问数据的效率不怎么好。

　　RAID5：分布式奇偶校验的独立磁盘结构

从它的示意图上可以看到，它的奇偶校验码存在于所有磁盘上，其中的p0代表第0带区的奇偶校验值，其它的意思也相同。RAID5的读出效率很高，写入效率一般，块式的集体访问效率不错。因为奇偶校验码在不同的磁盘上，所以提高了可靠性，允许单个磁盘出错。RAID 5也是以数据的校验位来保证数据的安全，但它不是以单独硬盘来存放数据的校验位，而是将数据段的校验位交互存放于各个硬盘上。这样，任何一个硬盘损坏，都可以根据其它硬盘上的校验位来重建损坏的数据。硬盘的利用率为n-1。但是它对数据传输的并行性解决不好，而且控制器的设计也相当困难。RAID 3 与RAID 5相比，重要的区别在于RAID 3每进行一次数据传输，需涉及到所有的阵列盘。而对于RAID 5来说，大部分数据传输只对一块磁盘操作，可进行并行操作。在RAID 5中有“写损失”，即每一次写操作，将产生四个实际的读/写操作，其中两次读旧的数据及奇偶信息，两次写新的数据及奇偶信息。 RAID-5的话，优点是提供了冗余性（支持一块盘掉线后仍然正常运行），磁盘空间利用率较高（N-1/N），读写速度较快（N-1倍）。但当掉盘之后，运行效率大幅下降。

　　RAID6：带有两种分布存储的奇偶校验码的独立磁盘结构

名字很长，但是如果看到图，大家立刻会明白是为什么，请注意p0代表第0带区的奇偶校验值，而pA代表数据块A的奇偶校验值。它是对RAID5的扩展，主要是用于要求数据绝对不能出错的场合。当然了，由于引入了第二种奇偶校验值，所以需要N+2个磁盘，同时对控制器的设计变得十分复杂，写入速度也不好，用于计算奇偶校验值和验证数据正确性所花费的时间比较多，造成了不必须的负载。我想除了军队没有人用得起这种东西。

　　RAID7：优化的高速数据传送磁盘结构

　　RAID7所有的I/O传送均是同步进行的，可以分别控制，这样提高了系统的并行性，提高系统访问数据的速度；每个磁盘都带有高速缓冲存储器，实时操作系统可以使用任何实时操作芯片，达到不同实时系统的需要。允许使用SNMP协议进行管理和监视，可以对校验区指定独立的传送信道以提高效率。可以连接多台主机，因为加入高速缓冲存储器，当多用户访问系统时，访问时间几乎接近于0。由于采用并行结构，因此数据访问效率大大提高。需要注意的是它引入了一个高速缓冲存储器，这有利有弊，因为一旦系统断电，在高速缓冲存储器内的数据就会全部丢失，因此需要和UPS一起工作。当然了，这么快的东西，价格也非常昂贵。

　　RAID10：高可靠性与高效磁盘结构

　　这种结构无非是一个带区结构加一个镜象结构，因为两种结构各有优缺点，因此可以相互补充，达到既高效又高速还可以的目的。大家可以结合两种结构的优点和缺点来理解这种新结构。这种新结构的价格高，可扩充性不好。主要用于容量不大，但要求速度和差错控制的数据库中。

　　RAID 50：被称为分布奇偶位阵列条带。

　　同RAID 30相仿的，它具有RAID 5和RAID 0的共同特性。它由两组RAID 5磁盘组成（每组最少3个），每一组都使用了分布式奇偶位，而两组硬盘再组建成RAID 0，实验跨磁盘抽取数据。RAID 50提供可靠的数据存储和优秀的整体性能，并支持更大的卷尺寸。即使两个物理磁盘发生故障（每个阵列中一个），数据也可以顺利恢复过来。

　　RAID 50最少需要6个驱动器，它最适合需要高可靠性存储、高读取速度、高数据传输性能的应用。这些应用包括事务处理和有许多用户存取小文件的办公应用程序。

　　RAID 53：称为高效数据传送磁盘结构。

　　结构的实施同Level 0数据条阵列，其中，每一段都是一个RAID 3阵列。它的冗余与容错能力同RAID 3。这对需要具有高数据传输率的RAID 3配置的系统有益，但是它价格昂贵、效率偏低。

　　RAID 1.5：是一个新生的磁盘阵列方式，它具有RAID 0+1的特性，而不同的是，它的实现只需要2个硬盘。

　　从表面上来看，组建RAID 1.5后的磁盘，两个都具有相同的数据。当然，RAID 1.5也是一种不能完全利用磁盘空间的磁盘阵列模式，因此，两个80GB的硬盘在组建RAID 1.5后，和RAID 1是一样的，即只有80GB的实际使用空间，另外80GB是它的备份数据。如果把两个硬盘分开，分别把他们运行在原系统，也是畅通无阻的。但通过实际应用，我们发现如果两个硬盘在分开运行后，其数据的轻微改变都会引起再次重组后的磁盘阵列，没法实现完全的数据恢复，而是以数据较少的磁盘为准。

　　（3）JBOD模式

　　JBOD通常又称为Span。它是在逻辑上将几个物理磁盘一个接一个连起来，组成一个大的逻辑磁盘。JBOD不提供容错，该阵列的容量等于组成Span的所有磁盘的容量的总和。JBOD严格意义上说，不属于RAID的范围。不过现在很多IDE RAID控制芯片都带着种模式，JBOD就是简单的硬盘容量叠加，但系统处理时并没有采用并行的方式，写入数据的时候就是先写的一块硬盘，写满了再写第二块硬盘……

　　实际应用中最常见的是RAID0 RAID1 RAID5 和RAID10 由于在大多数场合，RAID5包含了RAID2-4的优点，所以RAID2-4基本退出市场

　　现在，一般认为RAID2-4只用于RAID开发研究