使用PinYin4j.jar将汉字转换为拼音

来源:互联网 发布:flash cs6 mac 破解版 编辑:程序博客网 时间:2024/04/28 02:56

使用第三方包来处理汉子转拼音:

下载地址: 下载地址1

特征:

1. 支持多种拼音系统:

汉语拼音 
通用拼音 
威氏拼音 
注音二式 
雅礼 
国语罗马字 
2. 支持多音字

能够根据上下文获得正确的拼音

3. 支持多种拼音格式

大小写 
支持unicode ü 、v 和 u 
支持数字音调(lü3)、音调符号 (lǚ)和无音调标识(lü)




导入JAR包

测试代码:

package cn.cnxingkong.finder.tophonetic;import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;public class TestPinYin4J {/** * 将汉字转换为全拼 *  * @param src * @return String */public static String getPinYin(String src) {char[] t1 = null;t1 = src.toCharArray();String[] t2 = new String[t1.length];// 设置汉字拼音输出的格式HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();t3.setCaseType(HanyuPinyinCaseType.UPPERCASE);t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);t3.setVCharType(HanyuPinyinVCharType.WITH_V);StringBuilder sb = new StringBuilder();int t0 = t1.length;try {for (int i = 0; i < t0; i++) {// 判断能否为汉字字符if (Character.toString(t1[i]).matches("[\\u4E00-\\u9FA5]+")) {t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);// 将汉字的几种全拼都存到t2数组中sb.append(t2[0]);// 取出该汉字全拼的第一种读音并连接到字符串t4后} else {// 如果不是汉字字符,间接取出字符并连接到字符串t4后sb.append(Character.toString(t1[i]));}}} catch (BadHanyuPinyinOutputFormatCombination e) {e.printStackTrace();}return sb.toString();}/** * 提取每个汉字的首字母 *  * @param str * @return String */public static String getPinYinHeadChar(String str) {StringBuilder convert = new StringBuilder();for (int j = 0; j < str.length(); j++) {char word = str.charAt(j);// 提取汉字的首字母String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);if (pinyinArray != null) {convert.append( pinyinArray[0].charAt(0) );} else {convert.append(word);}}return convert.toString();}/** * 将字符串转换成ASCII码 *  * @param cnStr * @return String */public static String getCnASCII(String cnStr) {StringBuilder strBuf = new StringBuilder();// 将字符串转换成字节序列byte[] bGBK = cnStr.getBytes();for (int i = 0; i < bGBK.length; i++) {// System.out.println(Integer.toHexString(bGBK[i] & 0xff));// 将每个字符转换成ASCII码strBuf.append(Integer.toHexString(bGBK[i] & 0xff));}return strBuf.toString();}public static void main(String[] args) {String cnStr = "中国ren";System.out.println(getPinYin(cnStr));System.out.println(getPinYinHeadChar(cnStr));System.out.println(getCnASCII(cnStr));}}


原创粉丝点击