用stanford nlp的classfier组件的Java API做文本分类
来源:互联网 发布:网络上砌砖的美女 编辑:程序博客网 时间:2024/06/15 18:34
预处理:
找到classfier组件的类源代码ColumnDataClassifier.java,将其makeClassifier函数中
return lc;
改为
this.classifier = lc;
return lc;
将改后的类作为自定义类,比如改为StanfordClassifier.java,然后加入开发环境自己设定的package中。
环境准备:
请确定自己的开发环境中包含stanford nlp的库
准备数据:
配置文件train.prop,内容为
goldAnswerColumn=0
featureFormat=true
intern=true
useBinary=true
数据文件data.txt,内容为
student 上课
student 学习
student 考试
student 成绩
student 班级
teacher 教授
teacher 讲师
teacher 授课
teacher 课件
teacher 讲台
teacher 研究
teacher 课题
teacher 发表
teacher 论文
teacher 研究
teacher 著作
测试代码:
public static void testStanfordClassifier() {
StanfordClassifier cdc = new StanfordClassifier("D:/research/pclab/nlidb/classifier/train.prop");
String c = cdc.makeClassifier(cdc.readTrainingExamples("D:/research/pclab/nlidb/classifier/data.txt")).classOf(cdc.makeDatumFromLine("student教授"));
System.out.println(c);
}
参考:
1. http://blog.csdn.net/aws3217150/article/details/47045979
2. https://nlp.stanford.edu/software/classifier.shtml
3. https://github.com/stanfordnlp/CoreNLP/blob/master/src/edu/stanford/nlp/classify/ColumnDataClassifier.java
找到classfier组件的类源代码ColumnDataClassifier.java,将其makeClassifier函数中
return lc;
改为
this.classifier = lc;
return lc;
将改后的类作为自定义类,比如改为StanfordClassifier.java,然后加入开发环境自己设定的package中。
环境准备:
请确定自己的开发环境中包含stanford nlp的库
准备数据:
配置文件train.prop,内容为
goldAnswerColumn=0
featureFormat=true
intern=true
useBinary=true
数据文件data.txt,内容为
student 上课
student 学习
student 考试
student 成绩
student 班级
teacher 教授
teacher 讲师
teacher 授课
teacher 课件
teacher 讲台
teacher 研究
teacher 课题
teacher 发表
teacher 论文
teacher 研究
teacher 著作
测试代码:
public static void testStanfordClassifier() {
StanfordClassifier cdc = new StanfordClassifier("D:/research/pclab/nlidb/classifier/train.prop");
String c = cdc.makeClassifier(cdc.readTrainingExamples("D:/research/pclab/nlidb/classifier/data.txt")).classOf(cdc.makeDatumFromLine("student教授"));
System.out.println(c);
}
参考:
1. http://blog.csdn.net/aws3217150/article/details/47045979
2. https://nlp.stanford.edu/software/classifier.shtml
3. https://github.com/stanfordnlp/CoreNLP/blob/master/src/edu/stanford/nlp/classify/ColumnDataClassifier.java
阅读全文
0 0
- 用stanford nlp的classfier组件的Java API做文本分类
- stanford nlp库提供的nlp之外的分类、语义图、图最短路径功能
- CNN在NLP领域的实践(1) 文本分类
- 【NLP】使用朴素贝叶斯进行文本的分类
- 卷积神经网络在NLP领域的实践:文本分类[转]
- Stanford NLP Chinese(中文)的使用
- python 调用 Stanford NLP 的问题
- NLP 分类问题的讨论
- 用Stanford NER训练自己的NER分类器
- Java做的文本编辑器
- 用TextGrocery做文本分类
- 文本情感分类---搭建LSTM(深度学习模型)做文本情感分类的代码
- [nlp]意图分类是怎么实现的
- 文本分类-开方检验做特征提取的原理
- 在spark上做简单的文本分类(python)
- 使用Stanford NLP software进行中文文本预处理
- Python NLTK结合stanford NLP工具包进行文本处理
- python做nlp的工具nltk
- jdbc.propties后面一定不要有空格,否则容易错,还不容易找到
- caffe相关--Layers
- 线索二叉树(Binary Thread Tree)
- jsonp详解
- 没有谁是一座孤岛——《岛上书店》
- 用stanford nlp的classfier组件的Java API做文本分类
- 程序员,你为什么值这么多钱?
- Python Hook
- HDOJ 1312 Red and Black (简单dfs)
- Android Studio库Module引用aar文件
- redis集群搭建(同机器、不同机器搭建)
- MySQL存储引擎--MyISAM与InnoDB区别
- c++11——move/forward
- Gradle task简单使用