split的坑

来源:互联网 发布:淘宝cpu散片哪家好 编辑:程序博客网 时间:2024/05/19 19:39
之前有同事分享过,网上看到一个:
http://yinny.iteye.com/blog/1750210
补充一下,如果要解析类似csv的一行(但不需要处理转义),用String.split(str,sep,0)可以,它不会丢弃分出来的空串,但sep是regex,有性能问题,或者容易混淆。StringTokenizer虽然性能快,但是会把空串去掉。apache common lang3提供的接口最丰富,split会吃掉空串,splitPreverveAllTokens则会保留,适合处理csv一行。另外hadoop本身也带一个StringUtils可以处理csv,包括转义
0 0