python进行词性分析

来源:互联网 发布:网络视频怎么赚钱 编辑:程序博客网 时间:2024/05/01 06:57

表示python的nltk包真的很好用,本来想着自己从字典里面抓数据的,后来师兄建议用nltk包,

http://www.nltk.org/install.html

按照方法安装了包,接下来

import nltknltk.download()showing info http://nltk.github.com/nltk_data/Out[2]: TrueC:\Users\artemis_zrj\Desktop\nltk-3.0.0nltk.download()text=nltk.word_tokenize("And now for something completely different")nltk.pos_tag(text)Out[5]: [('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]


测试了一切正常。


同时介绍一本书,自然语言处理,虽然是讲自然语言处理的,但是同时也介绍了nltk包的各种应用。

输出的是list数组,数组里面的每个单位是tuple(元组)


有一个包是pattern包,http://www.clips.ua.ac.be/pattern

英文包里面提供了一些功能

http://www.clips.ua.ac.be/pages/pattern-en


提供了单数复数的切换

from pattern.en import pluralize, singularizeprint pluralize('child')print singularize('wolves')

比较级的切换 

from pattern.en import comparative, superlativeprint comparative('bad')print superlative('bad')
还有动词变化,数字的转换,



0 0
原创粉丝点击