python小程序-0005
来源:互联网 发布:开淘宝店进货渠道 编辑:程序博客网 时间:2024/06/10 18:25
第5题:有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
#!/usr/bin/env python3# -*- coding : utf-8 -*-import osimport refrom collections import Counterignore_words = ['I','am','is','be','that','the','and','maybe','it','a','not']def getWordNum(filesource): with open(filesource) as f: r = re.findall('\w+',f.read()) return Counter(r)def getImportantWord(dirpath): for file in os.listdir(dirpath): filepath = os.path.join(dirpath,file) totalCnt = getWordNum(filepath) for word in ignore_words: totalCnt[word] = 0 print('The most import word in %s is %s.' % (filepath,totalCnt.most_common()[0][0]))if __name__ == '__main__': dirpath = input('Please input dirpath: ') getImportantWord(dirpath)
阅读全文
0 0
- python小程序-0005
- python小程序
- python 小程序
- python小程序
- python 简单小程序
- python小程序集锦
- python爬虫小程序
- Python小程序
- python小程序
- python练习小程序
- Python入门小程序
- python 查询小程序
- [python] 小程序
- Python里小程序
- Python通讯录小程序
- Python小程序
- python界面小程序
- python小程序
- TCP流量控制
- 利用Python进行数据处理 笔记
- String命令介绍笔记(4)
- 一个典型的SSH登录与增删改查demo详解+源代码
- 【L,R的特点】codeforce 822C Hacker, pack your bags!
- python小程序-0005
- JSP提交到mysql数据库的中文乱码
- Memeory Monitor ---内存分配
- Python中进程创建的两种方式
- webpack
- python基础2之数据类型---元组
- Navicat for MySQL 新建查询时,报can't create file ...系统找不到指定的文件夹出现问题
- 用线程同步函数超时机制做计时器
- 什么是编程语言