统计英文单词的个数的python代码

来源:互联网 发布:淘宝成交额怎么算 编辑:程序博客网 时间:2024/04/30 15:22
word中对于英文单词统计也很好,大家不妨试试。如果没有安装word,而且你也是程序员的话,那么可以使用我的这段代码。通过测试,word的统计结果是18674,软件的统计结果是18349,相差不到2%,可以作为一个参考。 

  代码如下: 


# -*- coding: utf-8 -*- 

import os,sys 
info = os.getcwd() #获取当前文件名称 
fin = open(u'谷歌C++编程代码规范.txt') 

info = fin.read() 
alist = info.split(' ') # 将文章按照空格划分开 

fout = open(u'count.txt', 'w') 
fout.write('\n'.join(alist)) # 可以通过文本文件的行号同样看到效果 
##fout.write('%s' % alist) 
fout.close() 

allen = len(alist) # 总的单词数 
nulen = alist.count('') # 空格的数量 
print "words' number is",allen 
print "null number is",nulen 
print "poor words number is", allen-nulen # 实际的单词数目 

fin.close()
原创粉丝点击