python正则表达式惰性匹配

来源:互联网 发布:mac 终端配置 编辑:程序博客网 时间:2024/06/06 02:18

惰性匹配:匹配尽可能长的子串

非惰性匹配:匹配最短子串

python中的正则表达式默认为惰性匹配,如一个字符串为:<xxx><xxx><xxx><xxx>,正则表达式为<*>,匹配的结果为<xxx><xxx><xxx><xxx>。如果要改变为非惰性匹配只用在结束符前加?即可。例子如下:

content = '<xxxx><xxxx><xxxx><xxxx>'#惰性匹配print re.search('<.*>',content).span()#非惰性匹配print re.search('<.*?>',content).span()

注:python 中 re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。