pinyin4j简介
来源:互联网 发布:淘宝电子发票怎么申请 编辑:程序博客网 时间:2024/05/29 15:13
pinyin4j的主页:http://pinyin4j.sourceforge.net/
pinyin4j能够根据中文字符获取其对应的拼音,而且拼音的格式可以定制。
特征:
1. 支持多种拼音系统:
- 汉语拼音
- 通用拼音
- 威氏拼音
- 注音二式
- 雅礼
- 国语罗马字
2. 支持多音字
能够根据上下文获得正确的拼音
3. 支持多种拼音格式
- 大小写
- 支持unicode ü 、v 和 u
- 支持数字音调(lü3)、音调符号 (lǚ)和无音调标识(lü)
import net.sourceforge.pinyin4j.PinyinHelper; public class Pinyin /** /** public static void main(String[] args)
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
{
/**
* 将汉字转换为全拼
*
* @param src
* @return String
*/
public static String getPinYin(String src)
{
char[] t1 = null;
t1 = src.toCharArray();
// System.out.println(t1.length);
String[] t2 = new String[t1.length];
// System.out.println(t2.length);
// 设置汉字拼音输出的格式
HanyuPinyinOutputFormat t3 = new HanyuPinyinOutputFormat();
t3.setCaseType(HanyuPinyinCaseType.LOWERCASE);
t3.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
t3.setVCharType(HanyuPinyinVCharType.WITH_V);
String t4 = "";
int t0 = t1.length;
try
{
for (int i = 0; i < t0; i++)
{
// 判断能否为汉字字符
// System.out.println(t1[i]);
if (Character.toString(t1[i]).matches("[//u4E00-//u9FA5]+"))
{
t2 = PinyinHelper.toHanyuPinyinStringArray(t1[i], t3);// 将汉字的几种全拼都存到t2数组中
t4 += t2[0];// 取出该汉字全拼的第一种读音并连接到字符串t4后
}
else
{
// 如果不是汉字字符,间接取出字符并连接到字符串t4后
t4 += Character.toString(t1[i]);
}
}
}
catch (BadHanyuPinyinOutputFormatCombination e)
{
// TODO Auto-generated catch block
e.printStackTrace();
}
return t4;
}
* 提取每个汉字的首字母
*
* @param str
* @return String
*/
public static String getPinYinHeadChar(String str)
{
String convert = "";
for (int j = 0; j < str.length(); j++)
{
char word = str.charAt(j);
// 提取汉字的首字母
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray(word);
if (pinyinArray != null)
{
convert += pinyinArray[0].charAt(0);
}
else
{
convert += word;
}
}
return convert;
}
* 将字符串转换成ASCII码
*
* @param cnStr
* @return String
*/
public static String getCnASCII(String cnStr)
{
StringBuffer strBuf = new StringBuffer();
// 将字符串转换成字节序列
byte[] bGBK = cnStr.getBytes();
for (int i = 0; i < bGBK.length; i++)
{
// System.out.println(Integer.toHexString(bGBK[i] & 0xff));
// 将每个字符转换成ASCII码
strBuf.append(Integer.toHexString(bGBK[i] & 0xff));
}
return strBuf.toString();
}
{
String cnStr = "嘅囧誰說壞學生來勼髮視頻裆児";
System.out.println(getPinYin(cnStr));
System.out.println(getPinYinHeadChar(cnStr));
System.out.println(getCnASCII(cnStr));
}
}
- pinyin4j简介
- 中文转拼音Pinyin4j简介
- pinyin4j
- pinyin4j
- Pinyin4j
- pinyin4j
- pinyin4j
- pinyin4j
- pinyin4j
- pinyin4j
- pinyin4j
- Github最火开源项目-开源项目pinyin4j使用简介
- pinyin4j入门教程
- Pinyin4j使用手册
- PinYin4J 使用
- pinyin4J使用
- About pinyin4j
- pinyin4j学习
- 使用二进制格式序列化与反序列化DataSet数据集
- Linux实用代码--文件系统操作
- URL太长导致参数被截断的问题
- 5201314
- SQLserver2000时间计算整理
- pinyin4j简介
- PHP函数strtotime详解
- BREW中菜单的使用
- Installing the Microsoft Loopback Adapter for virtual pc.
- short int、long、float、double
- socket中阻塞与非阻塞,同步与异步
- XAMPP的下载与安装
- 20091127_english
- Install Intel GMA 4500MHD driver to Ubuntu8.04