中文排序要注意的问题

来源:互联网 发布:医院网络咨询工作好吗 编辑:程序博客网 时间:2024/05/29 16:44
  遇到了中文排序问题,比如想用拼音排序,
String[] strs = {"张三(Z)","李四(L)","王五(W)"};//排序,默认是升序Arrays.sort(strs);

 
发现排序结果是:张三(Z)","李四(L)","王五(W),后来看了下《高质量java 151个建议》
一书,发现找到了答案,原来是每一个字符采用uft-8编码来比较,因为张排在李的前面,
所以就有这个答案了。因此建议使用的是compareto排序,如下:
 
String[] strs = {"张三(Z)","李四(L)","王五(W)"};//定义一个中文排序器Comparator c = Collator.getInstance(Locale.CHINA);//升序排列Arrays.sort(strs,c);

  但对于中文复杂的同音字情况,依然会偶然有问题,这个时候,就建议使用如ping4j等开源工具来进行转化排序了
原创粉丝点击