jieba和thulac使用比较

来源：互联网发布：北京邮电大学网络编辑：程序博客网时间：2024/06/05 16:20

jieba和thulac使用比较

#coding=utf-8import thulacimport timeimport jieba#test='我们还提供更复杂、完善和精确的分词和词性标注联合模型Model_3和分词词表。该模型是由多语料联合训练训练得到（语料包括来自多文体的标注文本和人民日报标注文本等）'a=jieba.cut('我想听邓紫棋的忘情水')end2=time.time()print (' '.join(a))thu1=thulac.thulac(seg_only=True)text = thu1.cut('我要听邓紫棋的忘情水', text=True)end1=time.time()print (text)

Building prefix dict from the default dictionary ...
Loading model from cache /tmp/jieba.cache
Loading model cost 0.645 seconds.
Prefix dict has been built succesfully.
我想听邓紫棋的忘情水
Model loaded succeed
我要听邓紫棋的忘情水

jieba分词效果相对好些。

阅读全文

0 0

jieba和thulac使用比较
jieba和word2vec使用小结
清华THULAC分词软件python版使用
python︱六款中文分词模块尝试:jieba、THULAC、SnowNLP、pynlpir、CoreNLP、pyLTP
python-jieba分词的安装和使用
清华大学thulac分词和词性标注代码理解
sae上使用jieba
jieba的简单使用
jieba库的使用
jieba分词简单使用
jieba分词的使用
jieba
jieba
jieba
jieba
jieba分词使用代码示例
使用Python+jieba和java+庖丁分词在Spark集群上进行中文分词统计
使用Python+jieba和java+庖丁分词在Spark集群上进行中文分词统计
新一代PSIS系统
给定一个字符串，逐个翻转字符串中的每个单词
支付宝支付开发，微信支付开发
Android图表库MPAndroidChart(七)—饼状图
Mxnet:以全连接层为例子自定义新的操作(层)
jieba和thulac使用比较
SpringMVC的运行原理及整合
HDU 2147-kiki's game
DOM遍历
Andriod 安全之Windows下CTS自动化测试环境的搭建
排序算法四：归并排序基本原理以及Python实现
2017.8.21
Dynamics CRM 之Ribbon隐藏button
Android 自定义控件canvas- Layer图层