JAVA正则表达式

来源:互联网 发布:战网无法连接网络 编辑:程序博客网 时间:2024/06/03 14:23

正则表达式:符合一定规则的字符串

知识点介绍:

1  英文句点符号:匹配单个任意字符。

   eg:表达式t.o  可以匹配:tno,t#o,teo等等。不可以匹配:tnno,to,Tno,t正o等。

2  方括号:只有方括号里面指定的字符才参与匹配,也只能匹配单个字符。

   eg:表达式:t[abcd]n  只可以匹配:tan,tbn,tcn,tdn。不可以匹配:thn,tabn等。

3  | 符号:相当与“或”,可以匹配指定的字符,但是也只能选择其中一项进行匹配。

   eg:表达式:t(a|b|c|dd)n 只可以匹配:tan,tbn,tcn,tddn。不可以匹配taan,tn,tabcn

4  表示匹配次数的符号

     {n, }表示至少N次。

   eg:表达式:[0—9]{ 3}  \— [0-9]{ 2 }  \— [0-9]{ 3 } 的匹配格式为:999—99—999

因为“—”符号在正则表达式中有特殊的含义,它表示一个范围,所以在前面加转义字符“\”。

5  ^符号:表示否,^符号被称为“否”符号,若用在方括号内,“^“表示不想匹配的字符。

   eg:表达式:[^x] 第一个字符不能是x

6:圆括号,和空白符号

“\s”是空白符号,只可以匹配一个空格、制表符、回车符、换页符,不可以匹配自己输入的多个空格。

()是分组号,可以用ORO API提取处出值,后面将详细讨论。

7:正则表达式的一些快捷符号:

    \d表示[0—9],  \D表示[^0—9],  \w表示[0—9A—Z_a—z],

    \W表示[^0—9A—Z_a—z],  \s表示[\t\n\r\f],   \S表示[^\t\n\r\f]

8  一些常用的正则表达式:

Java:(([a-z]|_)(\\w*)){6,20}匹配以字母或下划线开头,字母数字下划线结尾的字符串

JavaScript:/^(\-?)(\d+)$/匹配数字。/^\w+$/匹配字母数字下划线。

.+ 一个或多个字符

/0 第一次匹配的字符串

9  java类中使用正则表达式:

eg1:

Patternp = Pattern.compile("t.n");

Matcher m = p.matcher(“ton”);

if(m.matches()){

       returntrue;

}

eg2:boolean bool=Pattern.matches (“t.n”,”ton”);

如果一个正则表达式要重复利用,用第一种,如果只匹配一次,第二种是最佳选择。

10  反斜线字符(‘\’)用于转义字符,同时还可以引用非转义字符(不包括非转义字母)

因此‘\\’表示‘\’,‘\{’表示{。  但是‘\y’就是错的,因为在不表示转义构造的 任何字母字符前 使用反斜线都是错误的。

Java LanguageSpecification 的要求,Java 源代码的字符串中的反斜线被解释为Unicode 转义或其他字符转义。因此必须在字符串字面值中使用两个反斜线,表示正则表达式受到保护,不被 Java 字节码编译器解释。例如,当解释为正则表达式时,字符串字面值 "\b" 与单个退格字符匹配,而 "\\b" 与单词边界匹配。字符串字面值 "\(hello\)" 是非法的,将导致编译时错误;要与字符串 (hello) 匹配,必须使用字符串字面值"\\(hello\\)"。:‘\b’是一个字符而‘\\b’是两个字符

11  Pattern类

(1)   8种模式:比如启用多行模式,启用unix模式等,eg  int CASE_INSENSITIVE表示启用不区分大小写的模式。

(2)   4个静态方法

   两个单例模式构造器:

   Pattern compile(String regex);

   Pattern compile(String regex,int flags)flags为八种模式的一种

  eg2:

  Pattern p=Pattern.compile("[a-z]\\s[a-z]");

  Matcher m=p.matcher("b  c");

  if(m.matches())   Sysout(1111);

  else Sysout(2222);  输出结果为1111;

一个匹配方法,一个返回String的字面值模式方法:

boolean matches(String regex,CharSequence input);//input与regex匹

配返回true。

String quote(String s);//返回指定String的字面值。

eg3:boolean bool=Pattern.matches("[a-z] [a-z]",”bc”); //结果为true

         Sysout(Pattern.quote(“a_#/tb”));//输出结果为 “\Qa_#     b”\E

(3)   6个普通方法

返回此模式的匹配器: Matcher  matcher(CharSequence input);

返回此模式的标志:   int flags();

返回此模式的regex: String pattern();

两个字符串切割方法: String[] split(CharSequence input);

                   String[] split(CharSequence input,intlimit);

        limit为返回字符串的个数,如果等于0,返回所有拆分的字符串,如果大于拆分字符串的实际个数,返回实际个数。

toString方法: String toString();

         


0 0
原创粉丝点击