Eclipse中ICTCLAS 2011 的java调用
来源:互联网 发布:怎么查看计算机端口80 编辑:程序博客网 时间:2024/05/21 11:12
本文由twenz整理。
以前ICTCLAS官方网站上并没有官方的java版本,只有一些爱好者根据c++改写的几个java版本供下载。2011/2009则提供了官方的java调用版本,但分词程序的实现应该还是基于c++的dll文件,只是提供了java的借口。下面简要介绍eclipse中使用ICTCLAS2011的简要步骤:
1. 下载最新版的分词开源软件ICTCLAS的java版(Windows)
ICTCLAS2011_Windows_32_jni
http://ictclas.org/ictclas_download.asp
2. 将ICTCLAS加入到工程中
下载的ICTCLAS50_Windows_32_JNI.rar\Sample\ictclas_sample_java解压到所建立的java工程中,如果工程中代码是放在src文件中的话,则可以把解压后的ICTCLAS文件夹拷贝到src源码文件夹中去
3. 运行分词软件ICTCLAS
将解压后的文件TestMain.java复制到工程的源码中去,即可以运行并分词。
4. 添加用户自定义的词典
由于提供的词典的词的数量不多,如“与时俱进”这一成语都不能分好,另外一些领域的词也没有,这样需要我们在用户词典中添加我们需要的词语。在解压的文件中有一个userdict.txt的文件,可以加入一些用户自定义的词语用作分词的词典。文件中有:
舟曲县城@@ZQXC
连夜@@LY
两个词。我如果加入一些词语如:
圣元
与时俱进
则能够将该这类词语分词。
ICTCLAS Init Fail 问题
问题1:ICTCLAS 2011 java 版本当调用次数增加时候就会导致内存不够而加载失败(Init Fail!)。我调用了300来次没有出问题,都是当调用500次以上时候就出现Init Fail!。在ICTCLAS bbs上一位朋友也遇到类似问题,解决办法是可以使用 开源的java包 或者ICTCLAS 2009(可以在官方网站上找到旧的版本).
问题2:ICTCLAS以前一直运行正常,但是过了一段时间,如半年后,出现init failed,是因为license 过期。重新下载替换ICTCLAS.dll(ICTCLAS30/50.dll)即可。
- Eclipse中ICTCLAS 2011 的java调用
- Eclipse中ICTCLAS 2011 的java调用
- ICTCLAS分词系统Java调用接口在Eclipse中的安装
- ICTCLAS分词系统Java调用接口在Eclipse中的安装
- ICTCLAS分词系统Java调用接口在Eclipse中的安装
- JAVA调用 ICTCLAS 分词接口
- JavaBean中调用ICTCLAS的dll给Jsp
- Java通过JNI调用ICTCLAS中文分词包的方法
- 中科院ICTCLAS的调用示例
- ICTCLAS分词系统Java调用接口在Eclipse中的安装- Java编程
- ICTCLAS java调用接口改动(zz陈天)
- 使用Java调用中科院分词NLPIR/ICTCLAS
- 使用Java调用中科院分词NLPIR/ICTCLAS
- ICTCLAS的C#调用时的BUG
- c# 调用ictclas.dll出现的异常
- ICTCLAS的JNI调用接口说明
- Eclipse环境下使用JNI调用中科院ICTCLAS分词
- ictclas分词系统的使用,java调用,附带连接mysql进行读写。
- 【转】中文论文写作格式
- 精品资源下载
- rundll32.exe加载dll
- Eclipse中Pydev的安装
- MIME协议(二) -- MIME
- Eclipse中ICTCLAS 2011 的java调用
- 情感词生成 [opinion mining]
- CSS 中background-img 的相关属性
- POJ 3821 Clickomania
- POJ 3842 排列问题
- C#爬取动态网页
- poj 3899 The Lucky Numbers
- poj解题报告整理
- poj 3847 树(链接表与堆栈的实现)