正则表达

来源:互联网 发布:数组去重代码 编辑:程序博客网 时间:2024/04/30 08:59
  正则表达式:符合一定规则的表达式,用于操作字符串,用一些特定的符号表示一些代码操作,简化对字符串的复杂操作。特殊符号的使用

弊端:符号定义越多,正则越长,阅读性越长

               字符类

           【abc】

           【^abc】

           【a-zA-Z】

预定义字符类 : \出现时必须成对出现

.    任何字符

\d   数字 :0-9

\D  非数字

\s   空白字符

\S   非空白字符

\w  单词字符 [a-zA-Z_0-9]

\W  非单词字符

数量词

X?        一次或一次也没有

X*        零次或多次

X+        一次或多次

X{n}      恰好 n 次

X{n,}      至少 n 次

X{n,m}    至少 n 次,但是不超过 m 次

      为了可以让规则的结果被重用,可以将规则封装成一个组(),组的出现都有编号,从1开始,想要使用已有的组,可以通过\\n(n组的编号)的形式获取

             具体操作功能:

1、         匹配:String  boolean matches(Stringregex) 用规则匹配整个字符串,只要有一处不符合规则,匹配结束,返回false

2、         切割: String String[] split(String regex)

3、         替换:public String replaceAll(String regex, String replacement)

4、         获取:将字符串中符合规则的子串取出

操作步骤:a、将正则表达式封装成对象

                    b、让正则对象和要操作的字符串相关联

                    c、关联后,获取正则匹配引擎

                    d、通过引擎对符合规则的子串进行操作,比如取出

1、如果只想知道该字符串是对是错,使用匹配

2、将已有字符串变成另一个字符串,使用替换

3、按照自定方式将字符串变成多个字符串,使用切割  :获取规则以外的子串

4、拿到符合需求的字符串子串,使用获取: 获取符合规则的子串