python中文分句
来源:互联网 发布:绝地求生游戏画面优化 编辑:程序博客网 时间:2024/04/30 07:17
# -*-coding=UTF-8-*-def cut_sentences(sentence): if not isinstance(sentence, unicode): sentence = unicode(sentence) puns = frozenset(u'。!?') tmp = [] for ch in sentence: tmp.append(ch) if puns.__contains__(ch): yield ''.join(tmp) tmp = [] yield ''.join(tmp)s = u'计算机评价效果,需要给定参考摘要作为标准答案,通过制定一些规则来给生产的摘要打分。 目前使用最广泛的是ROUGH系统(Recall-Oriented Understudy for Gisting Evaluation),基本思想是将待审的摘要和参考摘要的n元组共现统计量作为评价作为评价依据,然后通过一系列标准进行打分。包括(ROUGH-N, ROUGH-L, ROUGH-W,ROUGH-S和ROUGH-SU)几个类型。 通俗地将就是通过一些定量化的指标来描述待审摘要和参考文摘之间的相似性,维度考虑比较多,在一定程度上可以很好地评价Extracive产生的摘要'for i in cut_sentences(s): print(i)
0 1
- Python 中文分句
- python中文分句
- python中文处理问题——分句
- Python 中文处理问题——分句
- 以文件为单位的分句、分词python封装脚本
- 利用python对一段英文文本进行分词,分句
- 中文信息处理--分句
- 利用NLTK进行分句分词
- PYTHON 中文
- Python中文
- Python 中文
- 用正则表达式给email分句
- NLTK进行英文分句和分词
- 【Python学习】python中文分词
- 用python输出中文
- Python中文全攻略
- Python中文全攻略
- python中文处理
- 深入浅出js
- 解决IDEA不能debug的问题
- PTA 两个有序链表序列的合并
- elk 定时清理三天前数据
- jeecg报类型错误
- python中文分句
- PTA 小于m的最大的10个素数
- Linux命令(4)——declare/typeset命令(builtin)
- 对不起,迟到了
- 【Hadoop】Flume-ng源码解析之Sink组件
- 数字1的数量
- 关于spring mvc json请求 415问题
- 套接字编程(1)
- linux下 python安装