pinyin4j原理说明

来源:互联网 发布:淘宝基金不见了 编辑:程序博客网 时间:2024/06/15 01:56

由于项目上用到了pinyin4j这个开源库,我就很好奇它的实现原理,就看了一下它的代码。原来它就是相当于建立了一个hashset,把unicode的编码和汉语拼音对应了,如下:
3007 (ling2)
4E00 (yi1)
4E01 (ding1,zheng1)
4E02 (kao3)
4E03 (qi1)
4E04 (shang4,shang3)
4E05 (xia4)
4E06 (none0)
4E07 (wan4,mo4)
4E08 (zhang4)
4E09 (san1)
4E0A (shang4,shang3)
4E0B (xia4)
4E0C (ji1)
4E0D (bu4,bu2,fou3)
4E0E (yu3,yu4,yu2)
4E0F (mian3)
4E10 (gai4)
4E11 (chou3)
4E12 (chou3)
4E13 (zhuan1)
4E14 (qie3,ju1)

0 0
原创粉丝点击