linux下awk的关联数组

来源:互联网 发布:centos开机启动命令 编辑:程序博客网 时间:2024/05/30 02:25

昨天看了同事的一个shell脚本,如下:

awk 'NR==FNR{++a[$1]}a[$1]==0{print $1,a[$1]}' ./a.txt ./b.txt

作用是:打印出b.txt第一列中不在a中行,初一看,不是很懂,shell脚本没有系统的学过,平时用也只是一些简单的执行下可执行程序,跑下定时任务

NR和FNR,NR打印行数,FNR同样是打印行数,区别是后者每次打开一个文件时都会置0

a.txt

123

456

b.txt

456

789

111

awk '{print NR,FNR,$1}' a.txt b.txt

1 1 123
2 2 456
3 1 456
4 2 4567
5 3 90

看下这行语句,看怎么实现的吧

NR==FNR{++a[$1]} 表示打开第一个文件,建立一个关联数据a[$1]=1,即将文件一中第一列的每一行放到一个关联数组中了

这是第一个文件的处理,再看下第二个文件

a[$1]==0{print $1}如果a[$1]==0即对于第二个文件中,元素不在关联数组中则打印出来!

这样一个简单的语句就实现了功能,也有其他更简单的方法 比如grep -vwf a.txt b.txt

0 0
原创粉丝点击