智能中文分词小程序
来源:互联网 发布:dk哲学百科知乎 编辑:程序博客网 时间:2024/04/28 10:05
输入任意一篇中文文档,能够分析出里面可能的词组,然后输出,输入的文档越多,结果越准确,
不需要外部字典,输出的重点词汇用"*"开头,可以调整关键参数来调整准确率,附完整的源代码和测试文档(输入
的学习文档必须以ANSI编码保存,因为目前没有加入icu字符处理,并且固定了输入文档的文件名
命名规则,每个输入文档必须以file开头,后面跟连续的数字序号,从0开始,比如file0, file1,
不需要外部字典,输出的重点词汇用"*"开头,可以调整关键参数来调整准确率,附完整的源代码和测试文档(输入
的学习文档必须以ANSI编码保存,因为目前没有加入icu字符处理,并且固定了输入文档的文件名
命名规则,每个输入文档必须以file开头,后面跟连续的数字序号,从0开始,比如file0, file1,
file2, file3 。。。输入的学习文档和测试程序的可执行文件需要在同一目录)
源码下载URL:
http://download.csdn.net/detail/yuxing_hui/4837651
- 智能中文分词小程序
- 应用ICTCLAS的中文分词小程序
- 中文分词小总结
- 中文分词程序
- 简单的中文分词程序
- 简单的中文分词程序
- 中文分词程序源代码--DartSplitter
- 斯坦福大学的中文分词程序
- 一个小程序,分词系统。
- 编写简单的中文分词程序
- [转]编写简单的中文分词程序
- 编写简单的中文分词程序
- 编写简单的中文分词程序
- 简单的中文分词程序(C#源码)
- 一个简陋的中文自动分词程序
- 编写简单的中文分词程序
- 编写简单的中文分词程序
- [转]编写简单的中文分词程序
- 黑马程序员——多线程
- poj 1201 Intervals 差分约束+spfa
- hdu3037Saving Beans lucas定理
- linux的全局快捷键
- 高效的浮点数相等判定
- 智能中文分词小程序
- 17家中国初创公司的失败史
- GWT开发 - 创建GWT Maven Project
- spi总线的mmc卡驱动调试总结
- XMLHttpRequest Level 2 使用指南
- 爱上朴实的CSS细节
- HBase 0.1.0 Get流程源码分析
- LeetCode: Interleaving String
- 用fusioncharts展示json格式数据的图表