使用PinYin4j.jar将汉字转换为拼音

来源:互联网 发布:php判断是否为数字 编辑:程序博客网 时间:2024/04/28 02:54

可以使用pinyin4j.jar来实现将汉字转换为拼音的功能.代码如下:

[java] view plaincopy
  1. package mainApp;  
  2.   
  3. import net.sourceforge.pinyin4j.PinyinHelper;  
  4. import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;  
  5. import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;  
  6. import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;  
  7. import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;  
  8. import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;   
  9.   
  10. public class TestPinYin4j  
  11. {  
  12. /** 
  13. * 将汉字转换为全拼 
  14.  
  15. * @param src 
  16. * @return String 
  17. */  
  18. public static String getPinYin(String src)  
  19. {  
  20. char[] t1 = null;  
  21. t1 = src.toCharArray();  
  22. String[] t2 = new String[t1.length];  
  23. // 设置汉字拼音输出的格式  
  24. HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();  
  25. t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);  
  26. t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);  
  27. t3.setVCharType(HanyuPinyinVCharType.WITH_V);  
  28. String t4 = "";  
  29. int t0 = t1.length;  
  30. try  
  31. {  
  32. for (int i = 0; i < t0; i++)  
  33. {  
  34. // 判断能否为汉字字符  
  35. // System.out.println(t1[i]);  
  36. if (Character.toString(t1[i]).matches("[//u4E00-//u9FA5]+"))  
  37. {  
  38. t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);// 将汉字的几种全拼都存到t2数组中  
  39. t4 += t2[0];// 取出该汉字全拼的第一种读音并连接到字符串t4后  
  40. }  
  41. else  
  42. {  
  43. // 如果不是汉字字符,间接取出字符并连接到字符串t4后  
  44. t4 += Character.toString(t1[i]);  
  45. }  
  46. }  
  47. }  
  48. catch (BadHanyuPinyinOutputFormatCombination e)  
  49. {  
  50. e.printStackTrace();  
  51. }  
  52. return t4;  
  53. }   
  54.   
  55. /** 
  56. * 提取每个汉字的首字母 
  57.  
  58. * @param str 
  59. * @return String 
  60. */  
  61. public static String getPinYinHeadChar(String str)  
  62. {  
  63. String convert = "";  
  64. for (int j = 0; j < str.length(); j++)  
  65. {  
  66. char word = str.charAt(j);  
  67. // 提取汉字的首字母  
  68. String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);  
  69. if (pinyinArray != null)  
  70. {  
  71. convert += pinyinArray[0].charAt(0);  
  72. }  
  73. else  
  74. {  
  75. convert += word;  
  76. }  
  77. }  
  78. return convert;  
  79. }   
  80.   
  81. /** 
  82. * 将字符串转换成ASCII码 
  83.  
  84. * @param cnStr 
  85. * @return String 
  86. */  
  87. public static String getCnASCII(String cnStr)  
  88. {  
  89. StringBuffer strBuf = new StringBuffer();  
  90. // 将字符串转换成字节序列  
  91. byte[] bGBK = cnStr.getBytes();  
  92. for (int i = 0; i < bGBK.length; i++)  
  93. {  
  94. // 将每个字符转换成ASCII码  
  95. strBuf.append(Integer.toHexString(bGBK[i] & 0xff));  
  96. }  
  97. return strBuf.toString();  
  98. }   
  99.   
  100. public static void main(String[] args)  
  101. {  
  102. String cnStr = "陈";  
  103. System.out.println(getPinYin(cnStr));  
  104. System.out.println(getPinYinHeadChar(cnStr));  
  105. System.out.println(getCnASCII(cnStr));  
  106. }  
  107. }   

可以从CSDN的"资源频道"搜索"pinyin4j.jar"找到相关的资源,引入项目中就可以了.

pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。

特征:

1. 支持多种拼音系统:

汉语拼音 
通用拼音 
威氏拼音 
注音二式 
雅礼 
国语罗马字 
2. 支持多音字

能够根据上下文获得正确的拼音

3. 支持多种拼音格式

大小写 
支持unicode ü 、v 和 u 
支持数字音调(lü3)、音调符号 (lǚ)和无音调标识(lü) 

原创粉丝点击