自然语言处理环境搭建,就是这么简单–(手把手教程)

来源:互联网 发布:双11淘宝c店应该怎么办 编辑:程序博客网 时间:2024/06/04 19:57

最近看了一些关于自然语言处理方面的书,对其很感兴趣,在昨天晚上搞到了深夜,总算功夫不负有心人,现在基础环境已经搭建完成,闲言少叙,现将搭建的具体过程和遇到的问题分享给大家。

基础环境:windows 7 32位操作系统

1.安装Python(我安装的是Python2.7,目录C:\Python27可以到CSDNOSChinaSina Share等网站下载也可以到Python官网下载:http://www.python.org/(推荐用这个)。

2.添加环境变量。在命令行模式下输入:set PATH=%PATH%;C:\Python27这种方法最容易,当然也可以在计算机-->属性-->高级系统设置-->环境变量,添加系统变量,变量名为PATH,对应的属性值为C:\Python27即可。

3.在命令行模式下运行python,出现如下图所示,即说明Python已安装成功。

4.安装NLTK(我下载的是nltk-3.0.0)到这里下载:http://pypi.python.org/pypi/nltk

nltk-3.0.0解压到C:\Python27目录打开cmd,进到C:\Python27\nltk-2.0.3目录(输入:cd C:\Python27\nltk-3.0.0

输入命令:python setup.py install

5.这个时候,会报错,因为缺少setuptools包没有安装。下载setuptools包,地址:http://www.cncrk.com/downinfo/28512.html,安装后再运行python setup.py install命令即可。

6.安装PyYAML:到这里下载:http://download.csdn.net/detail/caicai1617/7023063

下载之后执行exe文件(程序会自动搜索python27目录)

7.在所有程序中找到python2.7文件夹,打开IDLE,输入import nltk,没有错误的话,就说明安装成功了。到这里,NLP所需的基本python模块都已经安装好了,然后要安装NLTK_DATA了下载NLTK_DATA有好几种方法,这里我只介绍。第一种:输入import nltk,然后输入nltk.download(),这样就可以打开一个NLTK DownloaderNLTK下载器)注意下载器下边的Download Directory,我设置的是C:\nltk_data。(这种方法很慢,并且安装了几次都不能全部安装)第二种:上360云盘下载:http://aczaym88yr.l3.yunpan.cn/lk/cgGUPFzF3spir,提取码为504e。下载好之后,放到C:\nltk_data目录下。因为是压缩包,选择C:\nltk_data\corpora目录下的所有压缩文件,选择解压到当前文件夹。(之后再用到其他的文件,再进行类似的解压即可)

8.在计算机-属性-高级系统设置-高级-环境变量-系统变量-新建:变量名:NLTK_DATA属性值:C:\nltk_data。这一步与上面第二步的操作基本相同。

9.在IDLE下输入:form nltk.book import  *会出现下图所示:

10.测试环境搭建的效果:接着第九步的操作,输入:text2.concordance('is');结果如下所示:

说明:text2NLTK数据包中的一段数据源,是一大串字符串。这句话实现的是从这一大串字符串中找寻出包含is这个单词的语句。

到此为止,基本的搭建已经完成,初学者的一点经验,也是每个要学习自然语言分析必会的基本知识。如有什么不懂的,欢迎在下面评论,我会及时回复。

 

 

 

0 0
原创粉丝点击