Python入门:文件内容去重操作

来源:互联网 发布:蘑菇云刷机软件 编辑:程序博客网 时间:2024/05/26 15:56


+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
  学习是一种态度,只要你有态度,学习将会是一种乐趣
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

应用场景

对行与行之间的重复内容进行删除
如:从网上download几个常用的用户名或密码字典文件,但是合并的时候,肯定有很多是重复的,在使用这些内容进行暴力破解的时候,因为重复行,导致破解效率下降,所以需要进行简单修改,去重:

#user.txtadmin root123userpassword  adminadministrator

应用代码

#Author:foryouslg#python3.5'''1、对特定文件内容进行去重操作(行与行之间的重复)2、请输入需要去重文件的绝对路径3、删除文件中的空行4、去除字符串前后空行5、生成一个以当前日期命名的文件'''import timeyear = time.localtime().tm_yearmon = time.localtime().tm_monday = time.localtime().tm_mdayhour = time.localtime().tm_hourmin = time.localtime().tm_minsec = time.localtime().tm_secnowtime = str(year) + str(mon) + str(day) + str(hour) + str(min) + str(sec)f = input("please entry the file[absolute path]:")def openThefile():    '''    1、打开要去重的文件    2、删除每行数据前后的无用字符    :return:    '''    ff = open(f,'r')    l = []    #for i in ff.readline():     #readline是文件中的第一行内容    for i in ff.readlines():    #所有内容中的每一行        if i != '\n' and i != '\r\n':   #删除空行            ii = i.replace('\t','').strip()            l.append(ii)    ff.close()    return ldef createNewfile(openThefile):    '''    去重操作    :param openThefile:    :return:    '''    l = []    for i in openThefile:        if i not in l:            l.append(i)    '''    创建新文件    '''    filename = f[:f.find('.')]    postfix = f[f.find('.'):]    theNewfile = open(filename + '_' + nowtime + postfix,'a')    '''    写入处理过的内容    '''    for i in l:        theNewfile.writelines(i+'\n')    theNewfile.close()if __name__ == '__main__':    createNewfile(openThefile())

执行后的结果

adminroot123userpasswordadministrator
1 1
原创粉丝点击