用 bash 脚本统计词频
来源:互联网 发布:js设置全局变量 编辑:程序博客网 时间:2024/05/17 04:19
上周有朋友问一问题,他有一个包含若干行IP地址的文本文件,每个IP占一行,需要统计每个IP在文件中出现的次数,并且按照出现次数逆序排列。
开始的时候使用了一个 awk 脚本来解决这个问题:
#!/bin/awk -f
# filename: count_ip.awk
BEGIN {
}
{
ip_map[$0]+=1
}
END {
for (ip in ip_map) {
print ip_map[ip] "/t" ip
}
}
再执行
$: cat ip_file | awk -f count_ip.awk | sort -nr
后来发现其实没必要这么麻烦,利用管道组合三条命令也可以完成这个工作:
$: sort ip_file | uniq -c | sort -rn
开始的时候使用了一个 awk 脚本来解决这个问题:
#!/bin/awk -f
# filename: count_ip.awk
BEGIN {
}
{
ip_map[$0]+=1
}
END {
for (ip in ip_map) {
print ip_map[ip] "/t" ip
}
}
$: cat ip_file | awk -f count_ip.awk | sort -nr
后来发现其实没必要这么麻烦,利用管道组合三条命令也可以完成这个工作:
$: sort ip_file | uniq -c | sort -rn
- 用 bash 脚本统计词频
- Java 用hashmap统计词频
- 词频统计
- 词频统计
- 词频统计
- 词频统计
- 词频统计
- 词频统计
- 词频统计
- 词频统计
- 词频统计
- 词频统计
- 词频统计
- 统计词频
- 词频统计
- 词频统计
- 用java写的词频统计
- 用ruby统计英文文章的词频
- Anders Hejlsberg
- 把一个数据库表中的数据导入到另一个数据库中解决方法
- RIA
- ACE简介
- newxy新坐标的事务管理
- 用 bash 脚本统计词频
- JDK1.5中LinkedBlockingQueue的bug
- 常用js脚本
- 使用 iptables
- 加壳脱壳(转)
- 一个龌鹾的人
- 符号数的识别
- 使用Visual Studio 2005创建以及移植智能设备自定义控件
- 用才应通权达变扬长避短