正则表达式:字符串中连续重复字符串的识别和替换

来源:互联网 发布:行业数据分析 编辑:程序博客网 时间:2024/05/17 07:49

今天编程的时候遇到一个正则表达式查找和替换的问题:对于字符串连续出现的字符,用“(重复字符)”替换。我想到用正则表达式比较高效。

对于字符串中的连续重复的字符,正则表达式是:

(.)\1+

以下是程序的片段:

 Pattern pattern = Pattern.compile("(.)\\1+"); Matcher matcher = pattern.matcher("111234445466"); //sb 缓冲区作为存储替换后的结果 StringBuffer sb = new StringBuffer(); //用正则表达式的find函数去判断,有没有匹配的结果集 while (matcher.find()) {    //match.group(0) 是匹配的字符串,比如111234445466中的111    //match.group(1) 是匹配的字符串的单个字符,比如111234445466中的111中的1    String repeat = matcher.group(1);    //appendReplacement用第二个参数去替换匹配成功的子串,并把结果存放在sb中,前面未匹配成功的也会放进去,后面的未匹配成功的不会放进去。例如:11123444546634 最后会替换成(1)23(4)54(6)    matcher.appendReplacement(sb, "("+repeat+")" ); } //把后面未匹配成功的附加到sb上,例如:11123444546634 最后会替换成(1)23(4)54(6)34 matcher.appendTail(sb); return sb.toString();
0 0
原创粉丝点击