Java字符串分割

来源：互联网发布：编程资料百度云编辑：程序博客网时间：2024/06/13 09:32

一、split()方法

public String[] split(String regex)  public String[] split(String regex,int limit)

参数说明：

regex：用于划分的正则表达式

limit：参数控制模式应用的次数，影响所得数组的长度。这个值可正可负可为零。limit为正数，表示返回的数组中元素的个数。

示例：

package com.learns.string;import java.util.StringTokenizer;public class test3 {public static void main(String[] args) {String t2 = "a:b:c:d:e:f";String[] split3 = t2.split(":",3);for(String s:split3){System.out.println(s);}}}

结果：

abc:d:e:f

常用分隔符注意事项：
1、"|"、"*"、"+" 、"."都必须加上转译字符，即前面加上"\\"。
2、还有一个更特殊的，如果分隔符是"\"，那就必须写成"\\\\"。
3、如果一个字符串中有多个分隔符，可以用"|"作为连接字符。如: String str = "我#爱-你"，则可以写成str.split("#|-")

二、StringTokenizer

StringTokenizer是一个用来分割String的应用类。这个类是出于兼容性的原因而被保留的遗留类，所以并不建议使用它，建议使用String类中的split()方法进行字符串切割

1、构造函数

StringTokenizer(String str)：构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
StringTokenizer(String str, String delim)：构造一个用来解析str的StringTokenizer对象，并提供一个指定的分隔符。
StringTokenizer(String str, String delim, boolean returnDelims)：构造一个用来解析str的StringTokenizer对象，并提供一个指定的分隔符，同时，指定是否返回分隔符。

参数说明：

str：要分割的String

delim：分割字符集合

returnDelims：表示分割符号是否作为标记返回。

2、常用方法

int countTokens()：返回nextToken方法被调用的次数。如果采用构造函数1和2，返回的就是分隔符数量。
boolean hasMoreTokens() ：返回是否还有分隔符。
boolean hasMoreElements() ：结果同2。
String nextToken()：返回从当前位置到下一个分隔符的字符串。
Object nextElement() ：结果同4。
String nextToken(String delim)：与4类似，以指定的分隔符返回结果。

示例：

package com.learns.string;import java.util.StringTokenizer;public class StringTokenizerTest {public static void main(String[] args) {String s = new String("The Java platform is the ideal platform for network computing");StringTokenizer st = new StringTokenizer(s," ",false);System.out.println( "Token Total: " + st.countTokens() );while( st.hasMoreElements() ){Object str = st.nextElement();System.out.println(str);}}}

结果：

Token Total: 10TheJavaplatformistheidealplatformfornetworkcomputing

三、区别

性能比较：

package com.learns.string;import java.util.StringTokenizer;import java.util.Vector;public class test {public static void main(String[] args) {String str = "abc";StringBuffer buffer = new StringBuffer();for(int i=0;i<1_000_000;i++){buffer.append(str).append(" ");}str = buffer.toString();// StringTokenizerlong curTime = System.currentTimeMillis();StringTokenizer token = new StringTokenizer(str," ");String[] array2 = new String[token.countTokens()];int i=0;while(token.hasMoreTokens()){array2[i++] = token.nextToken();}System.out.println("java.util.StringTokener:"+(System.currentTimeMillis()-curTime));// split方法curTime = System.currentTimeMillis();String[] array = str.split(" ");System.out.println("String.split:" + (System.currentTimeMillis()-curTime));// indexOf方法curTime = System.currentTimeMillis();Vector<String> vector = new Vector<String>();int index = 0;int offset = 0;while((index = str.indexOf(" ",index+1))!=-1){vector.addElement(str.substring(offset,index));offset = index+1;}String[] array3 = vector.toArray(new String[0]);System.out.println("Vector & indexof:"+(System.currentTimeMillis() - curTime));}}

结果：

java.util.StringTokener:550String.split:1052Vector & indexof:159

解释：StringTokenizer性能高于split方法，indexof性能最高

区别1：

package com.learns.string;import java.util.StringTokenizer;public class test3 {public static void main(String[] args) {String sample1 = "ben       ben";String[] split1 = sample1.split(" ");StringTokenizer tokens = new StringTokenizer(sample1," ");System.out.println(split1.length + " " + tokens.countTokens());}}

结果：

8 2

解释：如果用split进行分离的话，他会将空格也作为一个字符串存入数组，而StringTokenizer不会

区别2：

package com.learns.string;import java.util.StringTokenizer;public class test3 {public static void main(String[] args) {String t1 = "ben, ,,  ,,,ben";String[] split2 = t1.split(",");StringTokenizer tokens = new StringTokenizer(t1,",");System.out.println(split2.length + " " + tokens.countTokens());}}

结果：

7 4

解释：StringTokenizer会将连续相同的需要过滤的进行处理

参考文章：

http://ben-sin.iteye.com/blog/659611

https://my.oschina.net/jasonli0102/blog/272061

http://blog.csdn.net/e_wsq/article/details/32068337

0 0