python基础教程 re模块 学习笔记

来源:互联网 发布:淘宝京剧服装 编辑:程序博客网 时间:2024/05/21 16:57
1.什么是正则表达式
通配符:(.)
'python\\.org' = r'python\.org'
[abc] 匹配abc中的一个
[a-z] 匹配a-z中的一个
[^abc] 除了abc之外的字符
选择符和子模式
'python|perl' 两者之一
'p(ython|perl)'
可选项和重复子模式
r'(http://)?(www\.)?python\.org' 四种情况
()* ()? (){m,n}
字符串的开始和结尾
开始 ^  结尾 $


2.re模块
match 在字符串开头匹配
search 在字符串中匹配
split:
()中的字符会被保留
maxsplit设置分割次数的上限
findall
re.findall('[a-zA-Z]+',text) 找所有的单词
sub
sub(pat,repl,string)
escape
将特殊正则表达式字符转义,用来创建pat


3.匹配对象和组
match或search匹配成功返回MatchObject对象,包括子字符串的信息。
pat.group(n) 取出第n组
start(n) end(n) span(n) 第n组的开始、结束、开始和结束 的位置


4.作为替换的组号和函数
re.sub(pat,r'\1',string) 替换第一组内容
re.VERBOSE 允许在正则中插入注释
重复运算符后加 ?表示非贪婪模式 (.+) (.+?)
0 0
原创粉丝点击