Python pypinyin、jieba模块

来源:互联网 发布:matlab2016 mac破解版 编辑:程序博客网 时间:2024/05/22 06:53

Python pypinyin、jieba模块

今天学习了两个有用的模块,都是跟文字有关的:pypinyin,jieba

  • pypinyin是将汉字转换成拼音的
  • jieba实现了中文的分词

pypinyin 的官方说明文档位置:http://pypinyin.readthedocs.org/en/master/

jieba的官方说明文档位置:https://github.com/fxsjy/jieba/blob/master/README.md

两个官方文档内容不多,看起来也很方便,本人就不在博客里叨述了

自己试了一下pypinyin的函数:

import pypinyinpinyinlist = pypinyin.pinyin("谭维维", style=pypinyin.NORMAL)print(pinyinlist)pinyinlist = pypinyin.pinyin("落", heteronym=True)print(pinyinlist)pinyinlist = pypinyin.pinyin("四是四十是十", style=pypinyin.TONE)print(pinyinlist)

输出如下:

[['tan'], ['wei'], ['wei']][['là', 'luò', 'lào']][['sì'], ['shì'], ['sì'], ['shí'], ['shì'], ['shí']]

使用起来还是非常方便的

自己有一段时间没有更新博客了,自己毕业了,毕业期间好多事情需要弄,就没有继续撸代码,现在继续撸起来,每天进步一点点,日拱一卒,与各位共同进步!

0 0
原创粉丝点击