python统计文件中单词数

来源:互联网 发布:php ajax传递json 编辑:程序博客网 时间:2024/06/11 00:51

python统计指定文件中的各个单词数,主要用了正则表达式!


代码如下:

# # -*- coding: utf-8 -*-import re, os#re一般处理正则表达式from collections import CounterFILESOURCE = './a.txt'def getMostCommonWord(articlefilesource):    '''输入一个英文的纯文本文件,统计其中的单词出现的个数'''    pattern = r'''[A-Za-z]+|\$?\d+%?$'''    with open(articlefilesource) as f:        r = re.findall(pattern,f.read())        print(r)        print('*'*20)        return Counter(r).most_common()if __name__ == '__main__':    print(getMostCommonWord(FILESOURCE))


原创粉丝点击