Ubuntu 16.04 安装nltk

来源:互联网 发布:淘宝客怎么拉人 编辑:程序博客网 时间:2024/05/19 17:57

Ubuntu 16.04 安装nltk

nltk是非常好用的python自然语言处理的工具,安装nltk只需要安装命令安装就可以:

sudo -H pip install -U nltk

安装之后可以通过python里直接import nltk看看是否能用,一般都是可以引用了,不会出什么问题的。

安装了nltk但是需要部分语料数据,正常可以通过在python里import nltk之后,nltk.download()进行下载,但是由于部分下载很慢,所以我通过网上的下载好的数据解压进行的安装。

首先是我从网上下载了nltk-data,http://pan.baidu.com/s/1hq7UUFU,下载之后,通过scp的方式,将数据上传到工作站:

scp D:/CLASS/BLOG/nltk-data.zip XXX@XX.XX.XX.XX:~/

然后登陆工作站,就能查看到此文件了,然后再根目录下新建文件夹nltk_data,然后把压缩文件放到这个文件夹下,解压:

sudo mkdir nltk_datacp nltk_data.zip /nltk_data/sudo rm nltk_data.zipcd nltk_dataunzip nltk_data.zip

如果没有unzip命令的,去apt-get安装一个就可以了,如果你在读前面的时候,想尝试nltk.download()下载,然后断掉的,unzip解压过程中会提示是否覆盖文件,直接选择 (A)ll 就可以了,如果想的话可以nltk.download()里面update以下。

暂时使用的时候,可以使用分词,但是对于词性标注等功能还需要添加部分包,所以如果还要使用更多的功能,就需要静静的download和update了。

原创粉丝点击