Python入门:文件内容去重操作
来源:互联网 发布:蘑菇云刷机软件 编辑:程序博客网 时间:2024/05/26 15:56
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
学习是一种态度,只要你有态度,学习将会是一种乐趣
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
应用场景
对行与行之间的重复内容进行删除
如:从网上download几个常用的用户名或密码字典文件,但是合并的时候,肯定有很多是重复的,在使用这些内容进行暴力破解的时候,因为重复行,导致破解效率下降,所以需要进行简单修改,去重:
#user.txtadmin root123userpassword adminadministrator
应用代码
#Author:foryouslg#python3.5'''1、对特定文件内容进行去重操作(行与行之间的重复)2、请输入需要去重文件的绝对路径3、删除文件中的空行4、去除字符串前后空行5、生成一个以当前日期命名的文件'''import timeyear = time.localtime().tm_yearmon = time.localtime().tm_monday = time.localtime().tm_mdayhour = time.localtime().tm_hourmin = time.localtime().tm_minsec = time.localtime().tm_secnowtime = str(year) + str(mon) + str(day) + str(hour) + str(min) + str(sec)f = input("please entry the file[absolute path]:")def openThefile(): ''' 1、打开要去重的文件 2、删除每行数据前后的无用字符 :return: ''' ff = open(f,'r') l = [] #for i in ff.readline(): #readline是文件中的第一行内容 for i in ff.readlines(): #所有内容中的每一行 if i != '\n' and i != '\r\n': #删除空行 ii = i.replace('\t','').strip() l.append(ii) ff.close() return ldef createNewfile(openThefile): ''' 去重操作 :param openThefile: :return: ''' l = [] for i in openThefile: if i not in l: l.append(i) ''' 创建新文件 ''' filename = f[:f.find('.')] postfix = f[f.find('.'):] theNewfile = open(filename + '_' + nowtime + postfix,'a') ''' 写入处理过的内容 ''' for i in l: theNewfile.writelines(i+'\n') theNewfile.close()if __name__ == '__main__': createNewfile(openThefile())
执行后的结果
adminroot123userpasswordadministrator
1 1
- Python入门:文件内容去重操作
- Python入门:文件内容去重操作
- Linux文件内容去重
- python 数据库去重操作
- 文件内容去重及排序
- python文件过滤,去重,排序
- python---实战统计用户数量(文件操作、替换、列表、去重、元组)
- 利用Shell脚本进行文件内容去重
- python中的文件内容操作
- python实现对数组去重排序操作
- hive去重操作
- list去重操作
- python---实战3统计特定时间次数(文件操作、替换、列表、排序、去重、元组、集合)
- python list去重
- python列表去重
- python list 去重
- Python 序列去重
- Python list去重
- Android插件化开发
- 磁盘管理
- iOS本地推送
- 接近源生的android-async-http框架库使用基础
- [itweens插件] itween插件中文文档
- Python入门:文件内容去重操作
- JavaScript - This
- Apache cxf JaxWs基本应用
- linux常用命令-查找文件(find/locate)
- 一天一条Linux指令-true
- maven 内嵌tomcat 开发web 系统
- 高并发Java:NIO和AIO
- CSS3 基础(011_用户接口)
- 文章标题