java正则表达式学习总结,以及和javascript正则表达式的区别

来源:互联网 发布:淘宝卖家账户已被冻结 编辑:程序博客网 时间:2024/06/07 01:37

用正则表达式处理字符串功能非常强大,下面总结一下java正则表达式的一些知识:

 

基本元字符

.任何字符(与行结束符可能匹配也可能不匹配)

 

// 反斜杠
/t 间隔 ('/u0009')
/n 换行 ('/u000A')
/r 回车 ('/u000D')
/d 数字 等价于[0-9]
/D 非数字 等价于[^0-9]
/s 空白符号 [/t/n/x0B/f/r]
/S 非空白符号 [^/t/n/x0B/f/r]
/w 单独字符 [a-zA-Z_0-9]
/W 非单独字符 [^a-zA-Z_0-9]
/f 换页符
/e Escape
/b 一个单词的边界
/B 一个非单词的边界
/G 前一个匹配的结束

^为限制开头
$为限制结尾

 

加入特定限制条件[]
[a-z]     条件限制在小写a to z范围中一个字符
[A-Z]     条件限制在大写A to Z范围中一个字符
[a-zA-Z] 条件限制在小写a to z或大写A to Z范围中一个字符
[0-9]     条件限制在小写0 to 9范围中一个字符
[0-9a-z] 条件限制在小写0 to 9或a to z范围中一个字符
[0-9[a-z]] 条件限制在小写0 to 9或a to z范围中一个字符(交集)

[]中加入^后加再次限制条件[^]
[^a-z]     条件限制在非小写a to z范围中一个字符
[^A-Z]     条件限制在非大写A to Z范围中一个字符
[^a-zA-Z] 条件限制在非小写a to z或大写A to Z范围中一个字符
[^0-9]     条件限制在非小写0 to 9范围中一个字符
[^0-9a-z] 条件限制在非小写0 to 9或a to z范围中一个字符
[^0-9[a-z]] 条件限制在非小写0 to 9或a to z范围中一个字符(交集)

 

 

表示匹配次数的符号

 

{n,}:至少n次

 

“或”符号

可以使用“|”操作符。“|”操作符的基本意义就是“或”运算。要匹配“toon”,使用“t(a|e|i|o|oo)n”正则表达式。这里不能使用方扩号,因为方括号只允许匹配单个字符;这里必须使用圆括号“()”。圆括号还可以用来分组。

 

捕获组

 

>捕获组可以通过从左到右计算其开括号来编号。例如,在表达式 ((A)(B(C))) 中,存在四个这样的组:

1    ((A)(B(C)))2    /A3    (B(C))4    (C)

 

(?) 开头的组是纯的非捕获 组,它不捕获文本,也不针对组合计进行计数。

 

匹配模式

java正则表达式默认使用的是最长匹配模式,即:如果用ro*去匹配room,并将其替换为r,则结果为rm。

如果某些情况下想使用最短匹配,即:如果用ro?去匹配room,并将其替换为b,则结果为boom。

总结:默认使用最长匹配,但是结尾为"?"的模式使用的是最短匹配。

 

基本用法

Pattern pattern = Pattern.compile(正则表达式模式串);
Matcher matcher = pattern.matcher(要验证或处理的源字符串);

matcher.matches();如果匹配返回true,否则,false.

 

 

javascript正则表达式和java正则表达式的区别

javascript中的正则表达式和java的正则表达式基本上是相同的,区别在于分组引用和对象,方法

具体区别:

1).javascript正则表达式创建有两种方法:

a.显式创建:

var re = new RegExp("正则表达式模式串");

re.test(要校验或处理的源字符串);

 

b.隐式创建:

var re = /正则表达式模式串/;

要校验或处理的源字符串.match(re);

 

2).分组捕获对象引用方式不同

javascript也是使用"()"进行分组,但是捕获对象用RegExp对象的$1到$99来引用捕获对象。

 

 

附录:常用的javascript正则表达式,java的也类似

ip地址校验正则表达式(IPv4):

/^(/d{1,2}|1/d/d|2[0-4]/d|25[0-5])(/.(/d{1,2}|1/d/d|2[0-4]/d|25[0-5])){3}$/

 

Email校验正则表达式:

/^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(/.[a-zA-Z0-9_-]+)+$/

 

格式为:2010-10-08类型的日期格式校验正则表达式:

/^/d{4}-(0?[1-9]|1[0-2])-(0?[1-9]|[1-2]/d|3[0-1])$/

 

格式为:23:11:34类型的时间格式校验正则表达式:

/^([0-1]/d|2[0-3]):[0-5]/d:[0-5]/d$/

 

原创粉丝点击