语言处理与Python

来源:互联网 发布:linux怎么帮编写脚本 编辑:程序博客网 时间:2024/06/14 04:42

很基础的代码就不写了,只写不好记的还有难点。
参考书籍《Python自然语言处理》

#python3#链表链接起来组成单个字符串' '.join(['xiaochen','python'])#'xiaochen python'#字符串分割为链表'xiaochen python'.split()#['xiaochen', 'python']import nltknltk.download()可以下载到text1到text9共9篇文章from nltk.book import *#导入自然语言处理包sorted()排序FreqDist(text1)[w]#对text1中w字符进行出现频率统计set(text1)获得词汇表text1.collocations()找出频繁的双联词(特别是在已知单个词汇频率的基础上)fdist=FreqDist(samples)创建指定样本的频率分布fdist.keys() 以频率递减顺序排列的样本链表sent7 来自text7的第一句话[w for w in text if condition]模式:链表推导len(set([word.lower() for word in text1 if word.isalpha()])) 进一步过滤所有非字母元素
原创粉丝点击