自然语言处理——nltk库的安装使用

来源:互联网 发布:淘宝优惠券微信群起名 编辑:程序博客网 时间:2024/06/06 03:29

NLTK(Natural Language Toolkit)库简介

NLTK是一个开源的项目,包含:Python模块,数据集和教程,用于NLP的研究和开发
NLTK由Steven Bird和Edward Loper在宾夕法尼亚大学计算机和信息科学系开发。
NLTK包括图形演示和示例数据。其提供的教程解释了工具包支持的语言处理任务背后的基本概念

-来源于百度百科


NLTK的安装

1. 安装nltk

pip install nltk

2. 安装nltk_data

由于nltk_data 假设在国外站点,下载速度很慢,国内的话一般下载到timeit的时候就需要耗很长的时间,不过还好国内已经有压缩包可供下载。

请大家链接到这篇文章离线下载安装 NLTK 的 nltk_data 模块完成 nltk_data 的下载


NLTK的基本使用


在python控制台下输入

可以看到书籍的节点

输入节点名可以返回书籍信息


搜索文本

节点名.concordance(要搜索的文本)

比如说 text2.concordance('why')

搜索近义词

text2.similar('why')


更多请参照nltk的文档

原创粉丝点击