Python之正则表达式入门
来源:互联网 发布:淘宝便利店 编辑:程序博客网 时间:2024/06/05 08:57
突然想整理一下以前学的比较重要的东西。趁吃饭前,把正则表达式整理下吧。(谨适用于入门)
一、如何查找关键词
格式:关键词,如there或There
输出:所有包含关键词的句子
import rehandle = open('example.txt')for line in handle: line = line.strip() if re.search('there|There',line): print line
result:
二、首先如何按照”句首”来获取所需信息
格式:^关键词 ,如^There
输出: 所有开头为关键词的句子
import rehandle = open('example.txt')for line in handle: line = line.strip() if re.search('^There',line): print line
result:
前两项是比较基础的,可以在获取信息后再进行后续字符串的处理。
三、re字符的介绍
|: 或
^:表示开头
.:表示任意字符
*:表示任意个数
eg:
import rehandle = open('example.txt')buf = []for line in handle: line = line.strip() if re.search('^.*way.*',line): print line ''' y = re.findall('^.*way.*',line) if len(y)>0: buf.append(y)print buf'''
用findall()也可以
result:
\S: 任意非空格字符
+:任意个数(但至少一个)
?: 0个或1个
{n}:n为常数,代表几个个数,如[0-9]{3}表示3个数字
{a,b}:a个到b个之间
{a,}: 至少a个
如果把上面的改为
if re.search('^.*way.+',line):
则结果为:看看有什么不同
‘[0-9]’: 数字
‘[a-zA-Z]’:字母
‘[a-zA-Z0-9]’:字母或数字
‘[0-9.]’: 数字或.
‘[0-9.]+’: 如0.84
规律:[]里面放什么都行,比如 [#][.]
$:结束,如’,$’ 以逗号结束
\ $: ‘$’字符
eg:
import rehandle = open('example.txt')buf = []for line in handle: line = line.strip() if re.search('[a-z]+[#]',line): print line
result:
本文讲的比较浅,谨适用于入门,后续还得大家发挥自己的聪明才智融汇贯通。
阅读全文
0 0
- Python之正则表达式入门
- python 面向对象入门 - 之 正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门七之正则表达式
- Python爬虫入门一之正则表达式
- python正则表达式入门
- Python正则表达式入门
- python正则表达式入门
- python正则表达式入门
- python之正则表达式
- python之正则表达式
- 通过先序遍历和中序遍历建立二叉树
- 73. Set Matrix Zeroes
- c++基础之类的封装
- python numpy中数组.min()
- SpringMVC学习之简单示例(非注解)
- Python之正则表达式入门
- sleep和wait的区别
- 标称型和数值型数据
- oracle查看被锁的表和解锁
- LWC 56:718. Maximum Length of Repeated Subarray
- 修改IP地址失败的解决方法
- Java初学的一些笔记
- 数据结构学习记录-树的基本术语
- Redis 发布订阅