使用awk对广告数据中bid、imp中的ip做运营商分类统计

来源:互联网 发布:mac版cad和windows 编辑:程序博客网 时间:2024/05/21 17:23

经验:

1.    数据量较大的情况下使用shell脚本直接做数据的分类统计处理更方便

 

在对广告日志中的ip做了运营商识别后,还有最后一步就是需要分类统计这些运营商的分布信息,刚好最近粗浅地学习了shell awk,然后想要使用shell awk对文本进行统计分析(实际上是用exccel做countif电脑直接死翘翘)


文本文件字段长这样



列信息分别是bid_ip,bid_company, imp_ip, imp_company

目标是:统计bid_comapny,imp_company里面分别的分类统计

 

解决方法:

awk  ‘{s[$2] +=1} END {for(iin s){print i, s[i] }}’ ip_company.txt

awk  ‘{s[$4] +=1} END {for(iin s){print i, s[i] }}’ ip_company.txt