ICTClAS2016(NLPIR) 的python接口实现
来源:互联网 发布:淘宝买家秀搞笑带评价 编辑:程序博客网 时间:2024/06/12 09:05
ICTClAS2016(NLPIR) 的python接口实现
【注】该实现方法较为复杂,可以考虑python推出的pynlpir包来进行分词,具体操作参见博文【windows7 32位环境下pynlpir的安装与使用】
最近在使用python做自然语言处理的实验,python3.4下安装最新版的ICTClAS2016操作如下:
环境:win7 32位
在Python下可以采用的较好的中文分词工具是结巴中文分词和中科院的分词系统。我选用的是中科院分词系统ICTClAS。
步骤:
一、配置python的集成开发环境:
pycharm是用于开发python程序的集成开发环境。
1.首先下载安装python3.4,下载地址:https://www.python.org/downloads/
下载后按步骤安装即可。安装成功后配置环境变量,在path中添加python路径。
2.下载最新版的pycharm5.0.3专业版,地址:http://www.jetbrains.com/pycharm/download/#section=windows
P.s:(1)pycharm是收费的,有30天的试用期,破解办法:运行前先将自己的电脑日期往后设置几年,比如设置到2020.1.1,然后运行pycharm后,再将电脑时间改回即可。
(2)使用pycharm的时候选择解释器的时候,选择已安装的python即可。
二、安装python下的NLPIR/ICTCLAS
1.下载最新版的NLPIR/ICTCLAS,下载地址:http://ictclas.nlpir.org/downloads
2.将【Data】整个文件夹拷贝到【sample】--【pythonsample】下。
3.将【lib】文件夹里的各个型号的dll 拷贝到【pythonsample】 --【nlpir】里,替换原来的旧的dll,文件名字要对应更改,如拷过来的是win32下的NLPIR.dll,要对应的改成NLPIR32.dll 放到【pythonsample】 --【nlpir】里。
4.打开【pythonsample】里的nlpir.py :
(1)将libFile = './nlpir/NLPIR64.dll' 这一句里的dll改成对应自己系统版本的dll,例如是32位的,就改成libFile= './nlpir/NLPIR32.dll'
(2)第213行if not Init('',ENCODING.UTF8_CODE,''):改为:
### if not Init('',ENCODING.UTF8_CODE,''): #use this line for python 2.x
if not Init(b'',ENCODING.UTF8_CODE,b''): #use this line for python 3.x; for python3, string parameters should be bytes type
- ICTClAS2016(NLPIR) 的python接口实现
- ICTClAS2013(NLPIR) 的python接口实现
- ICTClAS2013(NLPIR) 的python接口实现 - 忘言
- ICTClAS2015(NLPIR) 的python接口实现
- NLPIR/ICTCLAS2016分词系统的文件结构
- java调用NLPIR(ICTCLAS2016)实现分词功能
- java调用NLPIR(ICTCLAS2016)实现分词功能
- java调用NLPIR(ICTCLAS2016)实现分词功能
- NLPIR(ICTCLAS2016)提取关键词功能
- NLPIR(ICTCLAS2016)对文本进行分词
- NLPIR(ICTCLAS2016)对词频统计功能
- NLPIR/ICTCLAS2016分词系统 使用心得
- NLPIR(ICTCLAS2015)python调用接口配置
- NLPIR中文分词的java接口使用方法
- NLPIR(ICTCLAS2016)分词系统添加用户词典功能
- NLPIR(ICTCLAS2016)分词系统添加用户词典功能
- (转)NLPIR(ICTCLAS2016)分词系…
- 中科院NLPIR/ICTCLAS2016分词系统找不到Configure.xml
- Data Binding基础学习笔记
- Eclipse Tomcat Project facet Java version 1.8 is not supported
- Java并发编程:CountDownLatch、CyclicBarrier和Semaphore
- 一起简单写一下AIDL,入个门
- Android系统源码阅读(10):Android 应用程序的消息处理机制
- ICTClAS2016(NLPIR) 的python接口实现
- 消息队列设计精要
- java的基础知识(1)
- 深度学习之caffe 模型格式化(Model format)
- activiti工作流07-processDefinition的CRUD
- (2.2.8.6)读懂 Android 中的代码混淆
- C#的第14节课的内容
- 解决 The following packages have been kept back 问题
- register_shutdown_function 函数详解