原来如此(glusterfs afr数据不一致问题定位)

来源:互联网 发布:excel数据合并汇总 编辑:程序博客网 时间:2024/06/04 19:22

接上篇“又忙碌了一个月“,终于定位在本地文件系统xfs的预分配策略上,导致glusterfs afr配置下,文件的预分配块占用的磁盘空间不一致,但是通过进一步md5验证,数据是没问题的,为了进一步确认,在其他机器上再次验证了一下,至少centos6.4的xfs 在不同套本地文件系统下,在长时间写入大量文件后,对于大文件的磁盘块预分配是不同的,也就是我们会看到同样的副本,在不同的机器本地文件系统xfs上 用ll -sh命令看到的文件大小虽然一样,但是已占用磁盘空间可能有差别,但是通过md5比对,数据其实是一致的。


还需再分析一下glusterfs的self-heal机制是如何比对文件进行文件数据识别和恢复的,同时也对比一下ceph中的rados的恢复原理,后面在分享到技术栏目里吧。


[P.S.: xfs的资源预分配还是较为复杂的,采用启发式的算法,暂时还没有精力去仔细研读代码,先记录下来]



备注几个问题,后续还要持续跟踪定位


使用版本:3.4.0qa8
0. 一个节点配置信息被删除了,原因不明;
1. 同步带宽低,在应用业务在线情况下受影响大;
2. 文件不同客户端节点列举不完整;
3. 同步总是有几个文件同步不完全,此时有应用业务在线;

原创粉丝点击