《中文分词算法研究》
来源:互联网 发布:微信刷流量软件 编辑:程序博客网 时间:2024/05/16 17:04
看完了才发现作者是经济管理学院的。
这是篇08年的论文。
目前国内外对于中文分词的主要研究成果分为以下几种:正向最大匹配法、反向最大匹配方法、分词与词性标注一体化方法、最佳匹配法、专家系统方法、最少分词词频选择方法、神经网络方法等。
ICTCLAS( Institute of Computing Technology, Chinese Lexical Analysis System)是由中国科学院计算技术研究所研究的基于多层隐马尔可夫模型HMM的汉语词法分析系统。
查全率Precision =分词结果中切分正确的总词数 / 分词结果中的总词数
查准率Recall =分词结果中切分正确的总词数 / 标准文本中的总词数
F1 = 2 ×Precison ×Recall / Precison +Recall
分词速度=分词文件大小 / 分词所用时间
根据这货的实验结果,ICTCLAS的查全率、查准率、F1比正向最大匹配法的好,分词速度慢了点。
0 0
- 《中文分词算法研究》
- 中文分词算法研究
- 中文分词算法的初步研究
- 中文分词研究史
- 中文分词研究入门
- 中文分词研究入门
- 中文分词研究入门
- 基于luence的中文分词算法研究(定长递归)
- 中文分词的一点研究
- 中文分词算法
- 中文机械分词算法
- 中文分词算法
- 中文分词算法
- 中文分词算法总结
- 中文分词算法
- 中文分词常用算法
- 中文分词算法
- 中文分词算法
- android EditView的一些问题
- Linux之认识和学习Bash
- 利用storyboard 自定义cell
- Mybatis中配置Mapper的方法
- Meteor——以NodeJS为基础环境,MongoDB为数据环境的全栈开发平台!
- 《中文分词算法研究》
- SparkSQL 相关API
- Mybatis整合Spring
- 二叉搜索树的后序遍历序列
- MATLAB 循环移位序列,二进制的按位循环右移/左移
- 转:docker实现原理之namespace
- C#+AE 用MapControl加载栅格格式文件
- matlab中的灰度共生矩阵相关函数用法
- Node.js学习笔记之三:事件