jieba库最常用操作

来源：互联网发布：linux系统哪个版本好编辑：程序博客网时间：2024/06/04 18:04

 import jieba>>> ss='中华人民共和国是世界上最强大的国家'>>> jieba.lcut(ss)**['中华人民共和国', '是', '世界', '上', '最', '强大', '的', '国家']>>> jieba.lcut(ss,True)['中华', '中华人民', '中华人民共和国', '华人', '人民', '人民共和国', '共和', '共和国', '国是', '世界', '上', '最强', '强大', '的', '国家']>>> jieba.lcut_for_search(ss)['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '世界', '上', '最', '强大', '的', '国家']

**1 精确模式
- jiaba.lcut(s):返回一个列表包含s中完整且不多余的分词
2 全模式
- jieba.lcut(s,True):返回一个列表包含s中所有可能的分词
3 搜索引擎模式
- jieba.lcut_for_search(ss):精确模式+对长分词全模式jieba
4 jieba.add_word(s):加入暂时识别不了的分词**

阅读全文

0 0