ICTCLAS函数说明
来源:互联网 发布:dw2017数据库面板插件 编辑:程序博客网 时间:2024/06/15 17:27
1.publicnative boolean ICTCLAS_Init(byte[] sPath);
参数:
sPath:最初的目录路径, Configure.xml 和Data 的存储路径
注意:ICTCLAS_Init()必须在ICTCLAS去其他操作之前调用
2.publicnative boolean ICTCLAS_Exit();
退出程序,释放所有资源和缓冲区
3.publicnative int ICTCLAS_ImportUserDictFile(byte[] sPath,int eCodeType);
导入用户自定义的数据字典,返回导入词条的数量,
参数:
sPath为用户字典的文件名
eCodeType为编码方式
4.publicnative int ICTCLAS_SaveTheUsrDic();
保存用户词典
1.本接口将会覆盖原有/data/文件夹用户相关词典。
2.用户可在配置文件中,指定下次是否使用该词典。
5.publicnative int ICTCLAS_SetPOSmap(int nPOSmap);
指定词性标注集
nPOSmap :
ICT_POS_MAP_FIRST //计算所一级标注集
ICT_POS_MAP_SECOND //计算所二级标注集
PKU_POS_MAP_SECOND // 北大二级标注集
PKU_POS_MAP_FIRST // 北大一级标注集
6.publicnative boolean ICTCLAS_FileProcess(byte[] sSrcFilename,int eCodeType, int bPOSTagged,byte[] sDestFilename);
处理文本文件
sSourceFilename:源文件路径
eCodeType:源文件的字符编码类型
bPOStagged:判断是否需要词性标注,0为不标记,1为标记,默认情况下:1。
sDsnFilename:存储结果的文件名。
7.publicnative byte[] ICTCLAS_ParagraphProcess(byte[] sSrc, int eCodeType, intbPOSTagged);
处理一个段落,并返回结果缓冲区指针
SSRC:源段
eCodeType:字符串的字符编码类型
bPOStagged:判断是否需要词性标注,0为不标记,1为标记,默认情况下:1。
8.publicnative byte[] nativeProcAPara(byte[] sSrc, int eCodeType, int bPOStagged);
分词,返回ICTCLAS_Result类对象对应的字节序列,需要按照一定的规则将其进行编码
将分词结果转化为stResult结构体输出
参数:
SSRC:源段落
eCodeType:资源的字符类型
bPOStagged:判断是否需要词性标注,0为不标记,1为标记,默认情况下:1
- ICTCLAS函数说明
- ICTCLAS
- ICTCLAS
- ICTClAS
- ICTCLAS
- ICTCLAS的JNI调用接口说明
- 学习 ICTCLAS 字典中保存函数
- 中科院ICTCLAS系统,ICTCLAS.dll的函数调用示例(C语言)
- 计算所汉语词法分析系统ICTCLAS 字典格式解析(字典格式说明)
- 关于在基于Struts构架的Java Web项目中加入ICTCLAS分词两点说明
- ICTCLAS 2009
- ICTCLAS 备忘
- ICTCLAS解析
- 函数说明
- 函数说明
- 函数说明
- 函数说明
- GLUT函数说明--绘制函数说明
- struts2 excel文件导入
- 来自极客标签10款最新设计素材-系列十七
- Centos 6.4 x86_64 安装QQ2012解决方案
- 在宏定义中使用 do{}while(0)
- Centos搭建SVN服务器
- ICTCLAS函数说明
- 2013/11/26 _ 新生赛总结&近期训练计划。
- Linux MYSQL因为区分大小写而引起找不到表
- 怎样解决网站内容源问题
- 安卓工程中各个文件夹
- oracle sequence
- QQ表情排列算法
- HTML5 LocalStorage 本地存储
- 从创建表空间到导入数据库