软件工程作业--02 WordCount

来源:互联网 发布:linux修改字符集编码 编辑:程序博客网 时间:2024/05/22 03:48

实验环境:windows主机 python环境
主要思路:

#01 字符数获取读取文件内容到字符串中,使用len()直接得到字符个数#02 行数获取使用简单的string.split()以换行符为间隔进行切片,使用len()获取所得列表元素个数即为文本行数#03 单词数获取(不完善)使用re模块的split()利用正则进行切片,正则如下:[,;:?\.\s]*再次利用len()获取所得列表元素个数得到单词总数

扩展:
递归获取文件:

使用os模块的walk()获取目录下所有的文件所在的目录以及文件名,通过os.path.join()进行拼接获取完整的文件路径,然后一次进行数据解析

参考链接:http://www.cnblogs.com/dachenzi/p/6792430.html
源码地址:https://github.com/MissGod1/WordCount

原创粉丝点击