python-用正则表达式筛选文本信息
来源:互联网 发布:宏业计价软件视频教程 编辑:程序博客网 时间:2024/06/05 15:37
【摘要】 本文主要介绍如何对多个文本进行读取,并采用正则表达式对其中的信息进行筛选,将筛选出来的信息存写到一个新文本。
文本基础操作
打开文件:open(‘文件名’,‘打开方式’)>>>file=open(r'C:\Users\yuanlei\Desktop\mytxt.txt','w+').为避免报错,在文件名的引号前加个r.
文件打开方式:只读——r或rt,rb为二进制文件;打开文件前清空文件内容——w或wt;在文末写入——a+;
清空内容然后在文末写入——w+;写到文件任意位置——r+;
关闭文件:文件打开运行好后必须要关闭——文件名.close()>>>mytxt.close()
读取文件中的内容:将每行内容,包括换行符,作为一个元素存入数组——lines=file_object.readlines(),但是这样会把换行符也赋进去
去除换行符——new_lines=lines.splitlines()
os包:import os 获取文件地址——os.listdir(父文件地址)
下面附上实现摘要中说的功能的完整代码:
# coding: utf-8#读取文本中的中英文数据并使用正则表达式将所需数据筛选入到一个新文本中import reimport os#zhengze函数对读取到的数据进行筛选,并将筛选好的数据存入数组new_linesnew_lines=[] #申明new_lines数组def zhengze(f): regex_str=".*?(l.*?e).*" for x in f: new_x = x.splitlines() #注意:splitlines是将传入的字符串去除'\n'之后以数组的形式传出,而不是字符串形式 match_obj=re.match(regex_str,new_x[0]) if match_obj: new_lines.append(match_obj.group(1)) else: new_lines.append('no') return new_lines#获取指定文件夹下的所有文本的绝对地址,并存入数组file_pathpath=r'C:\Users\yuanlei\Desktop\new_file_txt'file_path=[]for filename in os.listdir(path): #获取path下所有文件的路径 file_path.append((os.path.join(path,filename)))print file_path#对每个文本调用正则函数进行筛选,筛选过后的数据存入数组finalfor adress in file_path: file_object=open(adress) lines = file_object.readlines( ) #将文本中的内容以数组的形式(每行为一个元素)赋给lines file_object.close() final=zhengze(lines)print final#将筛选出来的数据写入新文本re_new.txtfile_2=open(r'C:\Users\yuanlei\Desktop\re_new.txt','w+')for x in final: file_2.write(x) file_2.write('\n')file_2.close()
阅读全文
1 0
- python-用正则表达式筛选文本信息
- python 正则表达式获取进程信息文本 ?P 用法
- Python中文文本信息抽取中常见的正则表达式
- NSPredicate 正则表达式 信息验证 筛选查询
- python 正则表达式筛选中文数字处理
- Python 3.6 正则表达式二 包含筛选IP正则表达式
- 用正则表达式筛选拖放文件类型
- Python 正则表达式限定文本长度
- Python 正则表达式在文本查询URL
- Python(10):文本处理,正则表达式
- python通过正则表达式提取文本
- python正则表达式与文本匹配
- Python 爬虫4——使用正则表达式筛选内容
- 用正则表达式处理文本
- 用正则表达式处理文本
- java 通过正则表达式 获取纯文本信息
- MySql 正则表达式 筛选 记录
- iOS-正则表达式用作筛选
- JavaWeb学习心得之自定义简单标签(二)
- 银行卡被神秘复制 腾讯安全专家揭秘背后黑色产业链
- 华为旗舰新机P9国内发布 携手徕卡共创手机摄影新高度
- 视频会议、智能报表...钉钉的免费午餐有了更多诱惑
- Java基础
- python-用正则表达式筛选文本信息
- 抓拍美女神器 快无边界vivo Xplay5或为全球最快拍照手机
- 做互联网电视,要拼背景吗?
- 大牌对决 小米5 /魅族PRO 6 /iPhone 6s Plus拍照对比
- 奥巴马体验的那款VR纸盒是什么来头?
- Nginx搭建静态文件服务器
- SDNU OJ 1182 奖学金
- 读书笔记-spring高级装配bean
- 如何写一个RPC框架(二):利用Bean容器和动态代理简化客户端代码