正则表达式基础应用(切割split(regex))

来源:互联网 发布:red hat linux 9 编辑:程序博客网 时间:2024/05/17 01:19

1. 基础字符串切割

要求:

按照空格将字符串切割

String a = "asd adsf    asdf        dfkajsd   yyy";
String reg1 = " +";  //1个或多个空格切割
String[] val = a.split(reg1);
for(String v : val){
System.out.println(v);
}


2. 按照特殊字符切割

要求:

按照点将字符串切割

特别说明:

在正则表达式中,. 为特殊字符,所以必须转义\. ,而在java字符串中\ 如果想正常表示也需要转义,就成为\\.

String b = "abc.sd.s.ldj.l44.sd";
String reg2 = "\\.";
String[] val1 = b.split(reg2);
for(String v : val1){
System.out.println(v);
}


3. 按照叠词完成切割,为了规则的结果可以被重用

要求:

按照有重复的字符串切割

特别说明:

正则表达式中()中的内容表示一个组,而组后面跟上\1 表示组的编号,此处表示重用组里规则过滤出来的值,这个就叫叠词

String c = "sdflddfkdfguuuflglglhlsgfaszzdk";
String reg3 = "(.)\\1+";  // 组里为任意字符,\\1为重用组里过滤出来的值,+表示多次利用组里规则过滤出来的值
String [] val2 = c.split(reg3);
for(String v : val2){
System.out.println(v);
}



补充: 

如下面正则表达式: ((a(b))(c)) 

怎么判断它是几个组呢?  

答: 只要数它有几个左括号或者几个右括号就行了,这里是4个组; 

那么怎么知道组的编号了?

答:从左至右数左括号,第一个就是第一组,一次类推。


总结补充:这个正是正则表达式的一个缺点,就是符号定义越多,正则越长,阅读行越差。说白了就是越牛的正则表达式越难看明白。


0 0
原创粉丝点击