正则表达式基础
来源:互联网 发布:mac切换输入法 编辑:程序博客网 时间:2024/05/22 06:48
一个正则表达式,必须首先要编译成为一个Pattern类的实例,这个Pattern对象将会使用matcher()方法来生成一个Matcher实例,接着便可以使用该 Matcher实例以编译的正则表达式为基础对目标字符串进行匹配工作,多个Matcher是可以共用一个Pattern对象的。
最强日期正则表达式
//javascript 的正则表达式
var regex = new RegExp( "\\[([^\\[^\\]]+)\\((\\d{1,6})\\)\\]" , "g" ); if (!regExp.test(layer.value))
//JAVA中正则表达式
//判断数字public static boolean isNumeric(String str){ Pattern pattern = Pattern.compile("[0-9]*"); return pattern.matcher(str).matches(); }
Pattern p = Pattern.compile("\\d");Matcher matcher = p.matcher("5");boolean isOk = matcher.matches(); System.out.println(isOk); //true // recycle the patternString tmp = p.pattern(); System.out.println(tmp); // \dPattern p2 = Pattern.compile(tmp);matcher = p.matcher("5");
Matcher类:
使用Matcher类,最重要的一个概念必须清楚:组(Group),在正则表达式中 ()定义了一个组,由于一个正则表达式可以包含很多的组,所以下面先说说怎么划分组的, 以及这些组和组的下标怎么对应的.
public String group()
返回由以前匹配操作所匹配的输入子序列。
这个方法提供了强大而方便的工具,他可以等同使用start和end,然后对字符串作substring(start,end)操作。
public String group(int group)
这个方法提供了强大而方便的工具,可以得到指定的group所匹配的输入字符串
(1).
下面我们看看一个小例子,来说明这个问题
\w(\d\d)(\w+)
这个正则表达式有三个组:
整个\w(\d\d)(\w+) 是第0组 group(0)
(\d\d)是第1组 group(1)
(\w+)是第2组 group(2)
我们看看和正则表达式匹配的一个字符串x99SuperJava,
group(0)是匹配整个表达式的字符串的那部分x99SuperJava
group(1)是第1组(\d\d)匹配的部分:99
group(2)是第二组(\w+)匹配的那部分SuperJava
下面我们写一个程序来验证一下:
String regex = "\\w(\\d\\d)(\\w+)";String candidate = "x99SuperJava";Pattern p = Pattern.compile(regex);Matcher matcher = p.matcher(candidate);if(matcher.find()){ int gc = matcher.groupCount(); for(int i = 0; i <= gc; i++)System.out.println("group " + i + ": " + matcher.group(i)); }System.out.println(p.pattern());
结果:
group 0: x99SuperJava
group 1: 99
group 2: SuperJava
\w(\d\d)(\w+)
(2)
Pattern p = Pattern.compile("B(ond)"); String candidateString = "My name is Bond. James Bond."; Matcher matcher = p.matcher(candidateString); matcher.find(); String group_0 = matcher.group(0); String group_1 = matcher.group(1); System.out.println("Group 0 : " + group_0); System.out.println("Group 1 : " + group_1); System.out.println(candidateString); //Find group number 1 of the second find matcher.find(); group_0 = matcher.group(0); group_1 = matcher.group(1); System.out.println("Group 0 : " + group_0); System.out.println("Group 1 : " + group_1); System.out.println(candidateString);
结果:
Group 0 : Bond
Group 1 : ond
My name is Bond. James Bond.
Group 0 : Bond
Group 1 : ond
My name is Bond. James Bond.
public Pattern pattern()
这个方法返回了,创建Matcher的那个pattern对象。
public Matcher reset()
这个方法将Matcher的状态重新设置为最初的状态。
public Matcher reset(CharSequence input)
重新设置Matcher的状态,并且将候选字符序列设置为input后进行Matcher, 这个方法和重新创建一个Matcher一样,只是这样可以重用以前的对象。
String candidateString = "My name is Bond. James Bond."; Pattern p = Pattern.compile("Bond"); Matcher matcher = p.matcher(candidateString); //Find the starting point of the first 'Bond' matcher.find(); int startIndex = matcher.start(); System.out.println(startIndex); // 11 //Find the starting point of the second 'Bond' matcher.find(); int nextIndex = matcher.start(); System.out.println(nextIndex); // 23
public int start()
这个方法返回了,Matcher所匹配的字符串在整个字符串的的开始下标:
public int end()
这个和start()对应,返回在以前的匹配操作期间,由给定组所捕获子序列的最后字符之后的偏移量。
其实start和end经常是一起配合使用来返回匹配的子字符串。
public boolean matches()
尝试将整个区域与模式匹配。这个要求整个输入字符串都要和正则表达式匹配。
和find不同, find是会在整个输入字符串查找匹配的子字符串。
public boolean find()
find会在目标字符串中寻找是否有匹配的子字符串,一般我们使用find的流程:
尝试在目标字符串里查找下一个匹配子串。
while(matcher.find()){
//在匹配的区域,使用group,replace等进行查看和替换操作
}
public boolean find(int start)
从输入字符串指定的start位置开始查找。
来源参考:
http://www.java3z.com/cwbwebhome/article/article8/81313.html?id=3138
http://www.jspcn.net/htmlnews/600100423.html
- 正则表达式基础表达式
- 正则表达式基础
- 正则表达式基础
- 正则表达式基础
- 正则表达式基础
- 正则表达式基础
- 正则表达式基础
- 正则表达式基础
- 正则表达式基础
- 正则表达式基础
- 正则表达式的基础
- 正则表达式基础
- 正则表达式基础
- 正则表达式入门基础
- 正则表达式基础
- Javascript正则表达式基础
- 正则表达式基础
- 正则(正规)表达式基础
- build.gradle文件详解
- git rebase简介(基本篇)
- C++中的智能指针(上)
- 招聘人员中哪些话不能相信
- malloc()在操作系统中的实现
- 正则表达式基础
- SQLServer
- [BZOJ 3671][Noi2014]随机数生成器:贪心
- 学习网站
- 项目管理利器-maven
- [转]通过六个题目彻底掌握String
- 深度学习物体检测(八)——YOLO2
- GuestName处理方法
- 删除重复结点