自然语言处理相关书籍

来源:互联网 发布:软件发明专利申请流程 编辑:程序博客网 时间:2024/05/18 03:03

书籍《Natural Language Processing with Java.pdf 》,英文文字版pdf,下载链接http://download.csdn.net/detail/yangyangrenren/9764585

    这本书,主要讲使用Apache’s OpenNLP, Stanford NLP libraries, LingPipe(相对较少)。全书首先对NLP进行了一个大概的介绍,这部分位于第一章。然后主要介绍:Finding Parts of Text(分词),Sentence Boundary Disambiguation(句子边界消歧),Named Entity Recognition(命名实体识别),Detecting Part of Speech(词性标注),Classifying Texts and Documents(文本文档分类),Using Parser to Extract Relationships(关系抽取)。这几章内容,主要是对OpenNLP与Stanford NLP的代码进行使用讲解。最后一章Combined Approaches(组合方法),首先介绍数据预处理的方法,然后对pipelines进行介绍。
    阅读时间为一天,大概可以初步掌握全书内容,可根据具体使用OpenNLP或者Stanford NLP来选择性阅读,代码可以直接参考书中的代码。书中的Stanford NLP示例,应该是比较老版本的,我没有详细对照,因为现在的Stanford NLP对java的版本要求是1.8以上,而书中是1.7版本的,不过方法思路依然可以借鉴。而且书中的讲解,几乎全部是针对英语;如果想了解下如果对中文进行NLP处理,可以参照我的其他博客。我主要对Stanford segmenter,NER,parser作了一下尝试,主要环境是ubuntu14.04,涉及到的运行环境有命令行与eclipse。
ps:还将继续阅读其他相关书籍,后面会继续补充。
Natural Language Processing with Python.pdf(英文文字版)
下载地址http://download.csdn.net/detail/yangyangrenren/9764606
PYTHON自然语言处理.pdf (中文文字版)
下载地址http://download.csdn.net/detail/yangyangrenren/9764601

0 0