LingPipe使用笔记

来源:互联网 发布:js 24小时时间插件 编辑:程序博客网 时间:2024/05/01 18:47

简介

LingPipe是一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of SpeechTagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(CharacterLanguage Modeling)、医学文献下载/解析/索引(MEDLINE Download, Parsing and Indexing)、数据库文本挖掘(DatabaseText Mining)、中文分词(Chinese Word Segmentation)、情感分析(SentimentAnalysis)、语言辨别(Language Identification)等API(来源:oschina)。

 

使用实例:

首先到http://alias-i.com/lingpipe/web/download.html下载免费版。我是在windows764位下做的测试,你的电脑需要安装3个软件:eclipse,jdk1.7,ant.

Eclipse下载地址:http://www.eclipse.org/downloads/

Jdk1.7下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html

Ant下载地址:http://ant.apache.org/

Eclipse是一个集成开发工具,jdk1.7是java编译器,ant类似c/c++中的make很强大,我也是菜鸟,ant入门教程:

http://www.java3z.com/cwbwebhome/article/article2/2764.html?id=1271

下面你们可以参考:

LingPipe拼写检查http://blog.csdn.net/fancyerii/article/details/6314130

 

语种识别(window下):

f:

cd F:\software\应用API\语种识别\lingpipe-4.1.0

cd demos/tutorial/langid

java -cplanguageId.jar;../../../lingpipe-4.1.0.jar RunLanguageId../../models/langid-leipzig.classifier "hello"

0 0
原创粉丝点击