分词
来源:互联网 发布:域名系统dns的作用 编辑:程序博客网 时间:2024/04/25 06:12
参考书籍
统计自然语言处理,清华大学,李宗庆著
分词软件
清华、复旦、stanford
方法
- 基于规则
- 基于统计
语料库+模型(贝叶斯、最大条件熵模型、隐马可夫、CRF、SVM)
汉语自动分词基本软件
- 正向/反向/双向
- 最少分词法(最短路径法)
- 基于语言模型的分词(语言模型工具SRLM)
- 基于HMM的分词方法
- 字构词的分词方法
CRF在模型上优于HMM和SVM
未登录词的识别
- 命名实体识别
- 中文姓名
老师要求: 编程能力+算法实现能力
引用块内容
0 0
- 分词
- 分词
- 分词
- 分词
- 分词
- 分词
- 分词
- 分词:分词词典CIPP_JS
- lucene分词器分词
- PHP分词
- 中文分词
- 中文分词
- 中文分词
- lucene分词
- Java分词
- 分词系统
- 中文分词
- 中文分词
- 《Python爬虫学习系列教程》学习笔记
- 扩展欧几里德算法
- 【SCOI2008】着色方案
- 安装虚拟机遇到和小红帽遇到的问题
- 2017-03-11 贪吃蛇
- 分词
- Android 与 H5-JS 简易交互
- 笔试题:字符串全排列
- javaweb_轻量级的多机同步资源解决方案
- 第一篇
- SSL 1021、洛谷 1037——产生数(dfs或高精度+Floyd)
- E/ G
- Python学习笔记-原始字符串
- 模拟生产环境使用thrift c++版