对文件分组

来源:互联网 发布:linux redhat jdk安装 编辑:程序博客网 时间:2024/05/18 02:30

将一堆文件中,相同内容的文件分为一组



通过字符串匹配速度太慢,首先应该想到的是将文件内容编码,譬如取其md5,或者其hash值,然后用map, 将md5相同的文件放在相同的key下


还有一个小优化的地方,就是先通过文件的size大体的分类