Python正则表达式中的 零宽断言  …

来源:互联网 发布:客户生日提醒软件 编辑:程序博客网 时间:2024/06/06 01:56
首先说明一下什么是零宽断言,所谓零宽断言就是并不去真正的匹配字符串文本,而仅仅是匹配对应的位置。正则表达式中有很多这样的断言,常见的如匹配字符串或者行的起始位置^ 和 /A,匹配字符串或者行的末尾 $ 和 /Z,单词边界/B等等。
这些简单的就不说了,正则表达式中只有当断言为真时才会继续进行匹配。
  
     (?:...)   非捕获组   只是无捕获组匹配exp,但不捕获匹配的文本,也不给这个组分配组号。

    (?=exp) 肯定式向前查找               它断言自身出现的位置的后面能匹配表达式exp

     (?!exp否定式向前查找              它断言自身出现的位置的后面不匹配表达式exp


     (?<=exp肯定式向后查找             它断言自身出现的位置的前面能匹配表达式exp

    (?exp否定式向后查找             它断言自身出现的位置的前面不匹配表达式exp



import re

pattern = re.compile('^(?!00).*find$')

string1 = '00 00 find'

string2 =  '11 00find'

s1 =pattern.search(string1)

if s1:

    prints1.group()

s2 =pattern.search(string2)

if s2:

 

    prints2.group()

返回

>>> 

 

11 00 find


^(?!00)就是说^这个表示开头,开头后面不跟有00。


注意

  •  group() 同group(0)就是匹配正则表达式整体结果
  •  group(1) 列出第一个括号匹配部分,group(2)列出第二个括号匹配部分,group(3) 列出第三个括号匹配部分。

这里如果用 prints2.group(1)  就会出错,所以说 (?!exp)这个括号并不表示捕获。也不分配组号。


import re
pattern =  re.compile('^((?!00).)*$')      ##只要字符串中出现00  就不匹配

string1 =  '00 00 find'
string2 =  '11 00 find'


s1 = pattern.search(string1)
if s1:
    print '1:' +s1.group()

s2 = pattern.search(string2)
if s2:
    print '2:' +s2.group()

这样就一个也不匹配。
表达式(?!00).会往前查找,看看前面是不是没有“00”字串,如果没有(是其它字符),那么.(点号)就会匹配这些其它字符。但这样只会匹配一次。

((?!00).)* 这样就能匹配0次或多次了。
注意 
^((?!00).)*$   以^ 开头, $结尾,表示在整个字符串中搜寻。


import re
pattern = re.compile('^((?!00).)*find$')

string1 =  '00 00 find'
string2 =  '11 00 find'
string3 =  '11 11 find'
string4 =  '11 11 find?'


s1 = pattern.search(string1)
if s1:
    print '1:' +s1.group()

s2 = pattern.search(string2)
if s2:
    print '2:' +s2.group()

s3 = pattern.search(string3)
if s3:
    print '3:' +s3.group()

s4 = pattern.search(string4)
if s4:
    print '4:' +s4.group()

>>> 
3:11 11 find

0 0
原创粉丝点击