Python与自然语言处理_第二期_NLTK入门之NLTK的基本使用

来源：互联网发布：黑沙捏脸数据导入编辑：程序博客网时间：2024/06/06 07:12

import nltkfrom nltk.book import  * #导入book这个语料#text1.concordance('monstrous')text4.dispersion_plot(["citizens","democracy","freedom","duties","America","you"])#text4.generate()len(text4)#获取文本长度set(text3)#统计text3的词汇sorted(set(text3))#统计text3的词汇并排序len(set(text3))#统计text3的词汇并获取词汇表长度text3.count("smote")#统计"smote"在文本中出现的次数text5.count("lol")#文本->词汇的链表sent1=['I','love','you']sent2 = ['I','love','you','too']sent2.append('a')#追加len(sent1+sent2)#可以使用加法连接多个链表sent2[0]#根据索引访问sent2[1:3]#切片

导入语料

在IDE中执行以下代码，把语料导入

from nltk.book import  *

搜索文本

统计词汇分布

计数词汇

统计文本词汇表

统计text3的词汇并排序

统计text3的词汇并获取词汇表长度

统计"smote"在文本中出现的次数

把文本看作是词汇的链表

0 0