Python与自然语言处理_第二期_NLTK入门之NLTK的基本使用

来源:互联网 发布:黑沙捏脸数据导入 编辑:程序博客网 时间:2024/06/06 07:12


import nltkfrom nltk.book import  * #导入book这个语料#text1.concordance('monstrous')text4.dispersion_plot(["citizens","democracy","freedom","duties","America","you"])#text4.generate()len(text4)#获取文本长度set(text3)#统计text3的词汇sorted(set(text3))#统计text3的词汇并排序len(set(text3))#统计text3的词汇并获取词汇表长度text3.count("smote")#统计"smote"在文本中出现的次数text5.count("lol")#文本->词汇的链表sent1=['I','love','you']sent2 = ['I','love','you','too']sent2.append('a')#追加len(sent1+sent2)#可以使用加法连接多个链表sent2[0]#根据索引访问sent2[1:3]#切片


导入语料

在IDE中执行以下代码,把语料导入

from nltk.book import  *


搜索文本


统计词汇分布






计数词汇


统计文本词汇表


统计text3的词汇并排序



统计text3的词汇并获取词汇表长度



统计"smote"在文本中出现的次数



把文本看作是词汇的链表




0 0