HDFS Erasure Coding
来源:互联网 发布:手机注销淘宝账号 后果 编辑:程序博客网 时间:2024/05/21 09:49
为什么要使用HDFS Erasure Coding
多副本的存储是昂贵的 - HDFS中的默认3x复制方案在存储空间和其他资源(例如,网络带宽)中具有200%的开销。 然而,对于具有相对较低I / O活动的热和冷数据集,在正常操作期间很少访问附加的块副本,但仍然会消耗和第一个副本相同的资源量因此,自然的改进是使用擦除编码(EC)代替复制,这提供了相同级别的容错能力,而且存储空间更少。 在典型的擦除编码(EC)设置中,存储开销不超过50%。 EC文件的复制因子是无意义的。 它始终为1,不能通过-setrep命令更改。
出现的背景
在存储系统中,最显着的EC使用是冗余磁盘阵列(RAID)。 RAID通过条带化实现EC,其将逻辑顺序数据(例如文件)分割成较小的单元(例如位,字节或块),并将连续的单位存储在不同的磁盘上。 在本介绍的其余部分,这种条纹分布单位称为条纹细胞(或细胞)。 对于原始数据单元的每个条带,计算并存储一定数量的奇偶校验单元 - 其过程称为编码。 可以通过基于幸存数据和奇偶校验单元的解码计算来恢复任何条带单元的错误。将EC与HDFS集成可以提高存储效率,同时仍然提供与传统基于复制的HDFS部署相似的数据耐久性。 例如,具有6个块的3x复制文件将消耗6 * 3 = 18个磁盘空间块。 但是使用EC(6个数据,3个奇偶校验)部署,它只消耗9个磁盘空间块
阅读全文
0 0
- 再聊HDFS Erasure Coding
- HDFS Erasure Coding
- erasure coding
- Erasure Coding
- hadoop-3.0.0-beta1运维手册(011):HDFS Erasure Coding纠删码使用
- Hadoop Erasure Coding结构分析
- HDFS and Erasure Codes (HDFS-RAID)
- Erasure Coding in WAS简单译文
- 使用Jerasure library实现一些erasure coding
- Erasure Coding in WAS简单译文
- Erasure Coding(纠删码)深入分析
- Erasure Coding(纠删码)深入分析
- Erasure Coding技术在Hadoop中的实现
- Erasure Coding(纠删码)深入分析
- Hadoop 3.0 Erasure Coding 纠删码功能预分析
- Hadoop 3.0纠删码(Erasure Coding):节省一半存储空间
- Hadoop 3.0 Erasure Coding 纠删码功能预分析
- Hadoop 3.0纠删码(Erasure Coding):节省一半存储空间
- 2---要多尝试学习新的设计方式
- git eclipse push 报错—(change 164 closed)
- 世界上第一个时序数据的Middle-Out算法压缩
- mybatis缓存
- MIPI D-PHY介绍
- HDFS Erasure Coding
- 分析 mtk lk 源代码
- [E][MH53] Holly’s Block Game
- linux中系统状态管理
- C++基础知识
- getField用法总结
- The application requires a java runtime environment 1.7.0
- NMS——非极大值抑制
- (二)SQL高级进阶