正则表达式贪婪模式

来源:互联网 发布:腾讯大数据300 编辑:程序博客网 时间:2024/05/09 04:45

+贪婪匹配与非贪婪匹配

贪婪匹配
 默认情况下,正则表达式使用最长匹配原则(也叫贪婪匹配原则)。
 例如:要将"zoom"中匹配"zo?"的部 分替换成"r",替换的的结果是"rom"。如果要将"zoom"中匹配"zo*"   的部分替换成"r",替换后的结果是"rm"。

非贪婪匹配
 当字符?紧随其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式变成了最短匹配原则(也 叫非贪婪匹配原则)。
 例如:在字符串"fooood"中,"fo+?"只匹配"fo"部分,而"fo+"匹配"foooo部分。

当正则表达式中包含能接受重复的限定符时,通常的行为是(在使整个表达式能得到匹配的前提下)匹配尽可能多的字符。以这个表达式为例:a.*b,它将会匹配最长的以a开始,以b结束的字符串。如果用它来搜索aabab的话,它会匹配整个字符串aabab。这被称为贪婪匹配。

有时,我们更需要懒惰匹配,也就是匹配尽可能少的字符。前面给出的限定符都可以被转化为懒惰匹配模式,只要在它后面加上一个问号?。这样.*?就意味着匹配任意数量的重复,但是在能使整个匹配成功的前提下使用最少的重复。现在看看懒惰版的例子吧:

a.*?b 匹配最短的,以a开始,以b结束的字符串。如果把它应用于aabab的话,它会匹配aab和ab

.*跟.*?的区别

.*?匹配点前面的字符到问号后面字符最短的匹配,而.*则匹配到最后一个能匹配到的

例子1、:匹配

<li title="中国人" name="外国人">中国人中国人</li>

正则如下:因为是匹配第一个双引号到接下来的双引号结束,否则如果用.*的话这个li有多个属性就一直匹配到最后一个属性的结束了

<li title=\"(.*?)\">([^<]*)</li>


0 0
原创粉丝点击