java正则表达式？=等特殊部分

来源：互联网发布：易语言自动更新源码编辑：程序博客网时间：2024/06/05 09:33

最近学习正则表达式，发现其中有一部分特殊结构，如？= 、？！、？<=等，这些在网上几乎找不到参考资料（也许鄙人搜索技术不过关），于是通过对API的阅读以及测试，大致了解了这部分内容。

本文只讲正则表达式里面比较少见的部分如？=等，常见的网上资料已经很多了！在此就不啰嗦了。

从API文档里面，我们可以看到有一部分正则表达式结构比较特殊，如下图：

首先，区别一下捕获内容和捕获组的区别：

比如下列字符串：

Lorem ipsum dolor sit amet consectetuer feugiat fames malesuada pretium egestas.

如果使用以下正则表达式匹配：

\b(\S)(\S)(\S)(\S*)\b

我们会得到如下结果:

Match "Lorem"     Group 1: "L"     Group 2: "o"     Group 3: "r"     Group 4: "em"Match "ipsum"     Group 1: "i"     Group 2: "p"     Group 3: "s"     Group 4: "um"...Match "consectetuer"     Group 1: "c"     Group 2: "o"     Group 3: "n"     Group 4: "sectetuer"...

从上例我们可以知道一个（）扩起来的称为一个捕获组，一个正则表达式（捕获内容）可以含有多个捕获组。

然后说明一下捕获组和非捕获组的区别：捕获组即是可以用group（）函数获取内容的，非捕获组则不在group（）内容之内。（注意无论是捕获组还是非捕获组，他们都能被正则表达式捕获到，只是非捕获组没有出现在group（）里面）。

接下来，让我逐行解释：

(?<name>X)： 匹配出X，表示一个命名了的捕获组，即不可以用group（int i）函数获取，而要用group(String name)函数获取。

(?：X)： 匹配出X，为捕获组。

(?idmsuxU-idmsuxU)： 匹配出""，匹配出所有的""(属于零长度匹配，可以百度)。

(?idmsuxU-idmsuxU：X)： 匹配出X

(?=X)：匹配出以X前面的内容（类似结束边界），如字符串ambassador，表达式 a（？=d）匹配出最后一个a。

(?！X)：匹配出以X后面的内容（类似开始）（仅通过部分测试，不太肯定）

(?<=X)：匹配出以X后面的内容（类似开始边界）

(?<！X)：匹配出以X前面的内容（类似结束边界）（仅通过部分测试，不太肯定）

(?>X)：匹配出以X，属于非捕获组。 (目前也不清楚independent是什么意思)

以上是鄙人愚见，有不妥之处，还望指正！另外，对于（？！X)和（？<=X)的区别（还有(？<！X)和（？=X) ），还有最后一个（？>X）的原文档的independent之意，在下暂不清楚，也希望和各位交流一下。

java正则表达式 ？=等特殊部分

java正则表达式？=等特殊部分