重复数据删除的详细信息

来源:互联网 发布:js中同步和异步的区别 编辑:程序博客网 时间:2024/05/21 04:01
IBM的IT服务能力在业界素来享有盛名,并且也很为用户所认可。例如,大庆油田勘探开发研究应用软件研究室主任单延明说,他们之所以选择IBM XIV作为云存储基础架构平台,不仅是XIV经受了他们严格的性能测试,还因为他们非常认可IBM的服务模式。


基于阵列的数据精简技术,例如,在数据被写入时,A-SIS在线运行,减少主存储容量。WAFL(NetApp的任意位置写入文件布局技术)的重复数据删除功能可实现写入时对4K数据块复本的识别(创建4K数据块的32-bit弱数字信号,接着一个字节一个字节地进行对比以保证不出现hash冲突),并将其放进元数据的一个签名文件。这一复本识别任务与快照技术相似;在控制器资源充足的情况下,是在后台进行的。其默认每24小时进行一次,每次更改的数据量可达20%。


从性能的角度来看,Scality并没有Isilon高效,但它提供了一种可能解决该问题的方法。


NetApp采用的方法和Isilon的方法一样“高性能”,而且是以更加简单的方式来解决这个问题,它并没有重复删除元数据的复制。重复数据删除在单个节点上实现,而集群更加智能于聚合同类型的文件。这对性能和重复数据删除都更加有利。


从本质上讲,NetApp 重复数据删除依赖的是一项成熟的计算机科学技术 — 引用计数。过去,Data ONTAP 仅跟踪数据块是闲置还是在使用。现在,借助重复数据删除,它还能跟踪数据块的使用次数。对于 NAS 和 SAN 配置,借助重复数据删除,单个块最多可引用 255 次。文件不“知道”它们在使用共享块 — 在 WAFL 中进行记录能以不可见的方式管理这些详细信息。
原创粉丝点击