数组排序(awk)
来源:互联网 发布:天猫国际与淘宝全球购 编辑:程序博客网 时间:2024/05/17 08:18
2011-08-04 wcdj
http://topic.csdn.net/u/20110803/14/86369f36-d4cd-47a4-9d6e-bc8185a6d201.html
问题:
比如说,文件格式如下:
a b x c d
x a c d a
c x x d v
...
每行有5个字段,统计每行出现x的次数,
并根据x的数量从小到大重排各行。
方法1:使用关联数组。(限制是每一行x的数量都必须不同)
awk中的数组的下标可以是数字和字母,称为关联数组。
# test.awk#BEGIN{#myarray[-1]=ARGV[1];# awk -f test.awk data#print myarray[-1]; # print data#}{cnt=0;for(i=0; i<NF; ++i){# debug#printf("%c ",$(i+1));if($(i+1)=="x"){++cnt;}}#printf("\n");myarray[cnt]=$0;}END{for(i=0; i<=NF; ++i){if(myarray[i]){print myarray[i];}}}
测试:data.txt
a b x c d
b x c x x
c x x d v
awk -f test.awk data
输出:
a b x c d
c x x d v
b x c x x
方法2:使用排序函数。(限制同方法1)
排序是经常用到的操作,然而原始版本的awk并没有内置的sort函数,想要排序数组的话只能自己实现一个sort函数。在gawk的3.1以后的版本,扩展提供了对数组的sort功能:asort和asorti函数。awk中并不存在真正的数组或者list,它的数组其实是关联数组模拟的,所以gawk中的sort接口都是针对关联数组的。
(1) asort函数
asort函数排序一个关联数组,排序后的数组的value值有序排列,数组的下表变为1,2,……,N,也就是说asort函数会舍弃原先关联数组的下标。这个是因为,想要按照固定的顺序访问关联数组,只能借助于下标的有序。
n = asort(data);
for (i = 1; i <= n; i++)
do something with data[i];
asort可以接受第二个参数,用来存储排序后的结果,这样原来的数组可以保持不变,避免了下标的丢失。
n = asort(source, dest);
for (i = 1; i <= n; i++)
do something with dest[i];
(2) asorti函数
在gawk3.1.2以后的版本还提供了一个asorti函数,这个函数不是依据关联数组的值,而是依据关联数组的下标排序,
n = asorti(source, dest);
for (i = 1; i <= n; i++) {
do something with dest[i]; Work with sorted indices directly
...
do something with source[dest[i]]; Access original array via sorted indices
3.1.0和3.1.1的版本的gawk没有提供这个函数,但是可以很容易通过asort函数进行模拟,编写自己的asorti函数。
# test.awkBEGIN{#myarray[-1]=ARGV[1];# awk -f test.awk data#print myarray[-1]; # print data}{cnt=0;for(i=0; i<NF; ++i){# debug#printf("%c ",$(i+1));if($(i+1)=="x"){++cnt;}}#printf("\n");myarray[cnt]=$0;}END{n=asorti(myarray, dest);# asorti(gawk3.1.2)for(i=1; i<=n; ++i){print myarray[dest[i]]; #print value of array}#for(i=0; i<=NF; ++i){#if(myarray[i]){#print myarray[i];#}#}}
方法3:使用 -F 分割和sort排序技巧。(没有限制)
- awk 数组 排序
- 数组排序(awk)
- shell awk数组&排序
- awk之数组排序(省略 | sort)
- awk 数组排序多种实现方法
- awk 数组排序多种实现方法
- awk 数组排序多种实现方法
- awk 数组排序-- asort 与 asorti
- awk 数组排序多种实现方法
- awk数组
- awk 数组
- awk数组
- awk 数组
- awk 数组
- awk 数组
- awk 数组
- awk 之 asort 与 asorti 数组排序区别及演示
- awk 之 asort 与 asorti 数组排序区别及演示
- 关于QNetworkInterface::allAddresses ()奇怪的问题
- kmp算法模板
- 去除eps图像的边框
- Xtreme.Toolkit.Pro
- FCKeditor.NET 自定义上传目录和文件名 [本人亲自测试通过]
- 数组排序(awk)
- 关于adr指令的理解
- 梦中忆起那已逝去十五年载的母亲泪水倏然而下
- 读取Excel时数据为空
- 你使用什么模型处理XBRL? - Charlie
- windows 7对资源管理器的改善
- 磁带驱动器的迁移难题
- 地理信息技术——平民化时代的来临(二)
- rest