多个文本文件两两碰撞相同内容

来源:互联网 发布:vm 网络上有重名 编辑:程序博客网 时间:2024/05/20 12:23
# -*- coding: cp936 -*-import os,sys,glob,itertoolsos.chdir(sys.path[0])def getsame(a,b):    la=[]    lb=[]    for i in open(a):        la.append(i.strip())    for i in open(b):        lb.append(i.strip())            ret =  list(set(la).intersection(set(lb)))      if len(ret)==0:        return a[:-4]+'-'+b[:-4]+' : 匹配个数 0'    else:        return a[:-4]+'-'+b[:-4]+'  : 匹配个数 '+str(len(ret))+'\r\n'+' '.join(ret)+'\r\n'fn=[]for i in glob.glob('*.txt'):    fn.append(i)for a,b in itertools.combinations(fn,2):    print getsame(a,b)        

0 0
原创粉丝点击