jieba库最常用操作

来源:互联网 发布:linux系统哪个版本好 编辑:程序博客网 时间:2024/06/04 18:04
 import jieba>>> ss='中华人民共和国是世界上最强大的国家'>>> jieba.lcut(ss)**['中华人民共和国', '是', '世界', '上', '最', '强大', '的', '国家']>>> jieba.lcut(ss,True)['中华', '中华人民', '中华人民共和国', '华人', '人民', '人民共和国', '共和', '共和国', '国是', '世界', '上', '最强', '强大', '的', '国家']>>> jieba.lcut_for_search(ss)['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '世界', '上', '最', '强大', '的', '国家']

**1 精确模式
- jiaba.lcut(s):返回一个列表 包含s中完整且不多余的分词
2 全模式
- jieba.lcut(s,True):返回一个列表 包含s中所有可能的分词
3 搜索引擎模式
- jieba.lcut_for_search(ss):精确模式+对长分词全模式jieba
4 jieba.add_word(s):加入暂时识别不了的分词**

原创粉丝点击