统计文本中单词使用频率
来源:互联网 发布:电子书资源知乎 编辑:程序博客网 时间:2024/05/21 15:51
#!/bin/bash#统计单词的频率if [ $# -lt 1 ]; thenecho "usage : $0 filename"fi filename=$1cp $filename $1_backupif [ ! -f $filename ]; thenecho "$filename is not a file"fitemp=$1_tempcat $filename | tr '[:punct:]' ' '\ | tr ' ' '\n' | tr 'A-Z' 'a-z' > $temp# 先把文本的中的标点全部替代成空格,然后把每个单词单独一行,全都转化成小写,方便后面的处理,输出到filename_temp文件中sed -i -E -e '/^$/d' -e '/^[0-9]+/d' $temp# 把filename_temp文件中的空行和字母开头的行删除,用-i写入文件sort $temp | uniq -c | sort -rn > $1_result.txt#先将sort按照字母排序,uniq对于连续的相同的行只输出一次,sort -r 逆序排序,默认是从小到大,输出结果到result.txt中rm $temp# 删除临时文件
- 统计文本中单词使用频率
- 如何使用linux命令统计文本中某个单词的出现频率
- 统计文本中各单词出现的频率(JavaWeb)
- python实现统计文本中单词出现的频率
- 统计英文文本单词出现频率
- 统计文本中英文单词的出现频率
- linux bash shell 统计一个文本中 单词 频率的 脚本详解
- 基于bf算法统计文本中某个单词出现的频率
- 统计文本中每个单词出现的频率(附C++完整程序)
- 模拟MapReduce编程的程序案例(用于统计文本中单词出现频率)
- 统计文件中单词出现的频率
- 统计一篇短文中单词出现频率
- 统计文本中单词数
- 个人项目:统计文本中的单词出现频率
- 统计单词频率-map
- Java统计单词频率
- [python]使用Counter统计文章中出现频率最高的单词
- Hadoop:使用原生python编写MapReduce来统计文本文件中所有单词出现的频率功能
- poj 2762 Going from u to v or from v to u?
- 编写超酷jQuery插件的10点建议
- 打造自己的vim界面--用winmanager合并显示NERDTree和TagList
- F4ck Fckeditor 的精简总结
- Build WebKit On Windows
- 统计文本中单词使用频率
- Git常用操作命令收集
- Eclipse调试Android工具集锦之二-DDMS
- JavaScript中的new-prototype面向对象实现原理
- 多线程知识点-java
- iphone UI 开发教程
- C语言和设计模式(适配器模式) 【文章都是来自网络,只要自己吸取了就是自己的】
- 自定义ArrayAdapter初始化item项
- 堆栈啥的