Python正则表达式基本字符集

来源:互联网 发布:远程桌面连接软件 编辑:程序博客网 时间:2024/05/29 03:13

1. 基本符号

.(英文句点) :通配符 - 用于表示任意字符

\(反斜杠):转义字符 - 如 \. 就表示单纯的英文句点符号了

[](中括号):字符集 - 表示里面的任意一个,如[abc],则匹配a,b,c中的任意一个。[pj]ython可以匹配python或jyson,注意并不能匹配pjython什么的。另外可以用[0-9]表示匹配任意一个数字,同理[a-z]或[A-Z]均合法。

^ :当放到字符集内开头时表示为‘非’,如[^abc]表示匹配除abc之外的任意字符 

^ :匹配字符串开头

$ :匹配字符串结尾(这两个实际中几乎用不到)

2. 数量词

*(星号):零个或多个,如a*可以匹配a, aa, aaa, ...也可以匹配为空

+(加号):一个或多个,与上面类似,但不可匹配为空

?(问号):0个或一个。

?(问号):把数量词变为非贪婪模式,比如,用ab*匹配abababababacdefg,默认会匹配到ababababab,即尽量长的匹配到,但ab*?则只匹配一个ab回来。实际用途较多

{m},重复m次,{m, n},重复m-n次,这两个实际用的不多

3. 预定义字符集

\d : 匹配数字,等价于[0-9]

\D : 匹配任意非数字字符,等价于[^0123456789]

\s : 匹配空字符,如\t(tab)、\r\n(回车)、‘ ‘(空格)、\f\v(并不知是什么)

\S : 匹配任意非空字符,即等价于[^\t\r\n\f\v ]

\w : 匹配任意英文字符或数字,等价于[0-9a-zA-Z]

\W :同理,和上面相反

原创粉丝点击