java 判断中文是否乱码

来源:互联网 发布:网络运维 编辑:程序博客网 时间:2024/05/17 08:18

Java判断中文是否乱码

[java] view plain copy
print?
  1. import java.util.regex.Matcher;  
  2. import java.util.regex.Pattern;  
  3.   
  4. public class ChineseUtill {  
  5.   
  6.     private static boolean isChinese(char c) {  
  7.         Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);  
  8.         if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS  
  9.                 || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS  
  10.                 || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A  
  11.                 || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION  
  12.                 || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION  
  13.                 || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {  
  14.             return true;  
  15.         }  
  16.         return false;  
  17.     }  
  18.       
  19.     public static boolean isMessyCode(String strName) {  
  20.         Pattern p = Pattern.compile("\\s*|\t*|\r*|\n*");  
  21.         Matcher m = p.matcher(strName);  
  22.         String after = m.replaceAll("");  
  23.         String temp = after.replaceAll("\\p{P}""");  
  24.         char[] ch = temp.trim().toCharArray();  
  25.         float chLength = 0 ;  
  26.         float count = 0;  
  27.         for (int i = 0; i < ch.length; i++) {  
  28.             char c = ch[i];  
  29.             if (!Character.isLetterOrDigit(c)) {  
  30.                 if (!isChinese(c)) {  
  31.                     count = count + 1;  
  32.                 }  
  33.                 chLength++;   
  34.             }  
  35.         }  
  36.         float result = count / chLength ;  
  37.         if (result > 0.4) {  
  38.             return true;  
  39.         } else {  
  40.             return false;  
  41.         }  
  42.     }  
  43.       
  44.       
  45.     public static String toChinese(Object msg){  
  46.         String tempMsg = TransformUtils.toString(msg) ;  
  47.         if(isMessyCode(tempMsg)){  
  48.             try {  
  49.                 return new String(tempMsg.getBytes("ISO8859-1"), "UTF-8");  
  50.             } catch (Exception e) {  
  51.             }  
  52.         }  
  53.         return tempMsg ;   
  54.     }  
  55. }