c/c++运用nlpir进行自动化中文分词

来源:互联网 发布:网络伤感情歌对唱 编辑:程序博客网 时间:2024/04/29 19:06

由于毕业设计的需要,需要运用自动化分词和提取关键词,这个对于不专业的我还颇具难度,最开始把分词包直接加入到python中一直没有成功。在C下配置成功,记录一下步骤


用vs2013创建新项目,选择控制台程序,命名为nlpir

点击下一步,不要选中预编译头,然后点完成

在nlpir.cpp中写入下列代码(其中1.txt是待处理的文本):

#include <iostream>#include <fstream>#include <string>using namespace std;#include "NLPIR.h"#pragma comment(lib,"NLPIR.lib")int main(int argc, char *argv[]){ifstream fin("1.txt", ios::in);if (!fin){ cout << "1.txt file read error!" << endl; return -1; }string text, tempstr;while (!fin.eof()){getline(fin, tempstr);text += tempstr + "\r\n";}cout<<text<<endl;if (!NLPIR_Init()){cout << "NLPIR_Init() error!" << endl;return -1;}string resulttext = NLPIR_ParagraphProcess(text.c_str(), 1);cout << resulttext << endl;int a;cin>>a;NLPIR_Exit();return 0;}

下载nipir分词系统

将bin\ICTCLAS2015路径下的NLPIR.dll

根路径下的data文件夹

include路径下的NLPIR.h文件

lib\win32下的NLPIR.lib文件

复制到工程nlpir的nlpir文件夹下(共有4个文件)



将待处理文件1.txt复制到nlpir文件夹下,然后就可以运行了



配置成功后可以查看分词系统doc文件夹下的开发手册,调用其它相应的函数接口










参考文档:ht tp://hi.baidu.com/doubleysl/item/9176c689b5683b2f110ef324


0 0
原创粉丝点击