GNU AWK

来源:互联网 发布:流程图在线制作软件 编辑:程序博客网 时间:2024/06/07 02:58

awk

awk官方给出的是 pattern scanning and processing language即模式扫描处理语言,我们CentOS一般用的是GNU AWK,官方给出的语法有五种,我们只举例前两种使用格式,下面是语法:

   gawk [ POSIX or GNU style options ] -f program-file [ -- ] file ...   gawk [ POSIX or GNU style options ] [ -- ] program-text file ...   pgawk [ POSIX or GNU style options ] -f program-file [ -- ] file ...   pgawk [ POSIX or GNU style options ] [ -- ] program-text file ...   dgawk [ POSIX or GNU style options ] -f program-file [ -- ] file ...

语法

gawk [ POSIX or GNU style options ] [ – ] program-text file …

  • -F 指定分隔符;
  • -v var=value 赋值变量,使AWK处理过程中可以调用

* -v 表示变量

FS:输入字段分隔符,默认空白字符为分隔符awk -v FS=':' '{print $1,FS,$3}’ /etc/passwdawk –F: '{print $1,$3,$7}’ /etc/passwdOFS:输出字段分隔符,默认为空白字符,使用,号进行使用,也可以命令内部使用OFS的变量awk -v FS=‘:’ -v OFS=‘:’ '{print $1,$3}’ /etc/passwdawk -v FS=":" -v OFS=": " '{print $1OFS$3}' /etc/passwdRS:输入记录分隔符,指定输入时的换行符,原换行符仍有效[root@localhost ~]#awk -v RS=" " '{print NR,$0}' /root/f1.test1 aaa2 bbb3 cccabcd4 bcd5 cdefitgeslk[root@localhost ~]#cat f1.testaaa bbb cccabcd bcd cdefitgeslk[root@localhost ~]#     ORS:输出记录分隔符,输出时用指定符号代替换行符awk  -v ORS='###'‘{print }’ /root/f1.test1 aaa bbb ccc###2 abcd bcd cd###3 efi###4 tge###5 slk###[root@localhost ~]#NF:字段数量awk -F: ‘{print NF}’ /etc/fstab,引用内置变量不用$ 显示每行的列数awk -F: '{print $(NF-1)}' /etc/passwd    打印出倒数第二个字段awk -F: '{print $NF}'/etc/passwd 打印最后一个字段NR:行号awk '{print NR}' /etc/fstab ; awk END'{print NR}' /etc/fstabFNR:各文件分别计数,行号awk '{print FNR}' /etc/fstab /etc/inittabFILENAME:当前文件名awk '{print FILENAME}’ /etc/fstab[root@localhost ~]#awk '{print FILENAME}' /etc/fstab/etc/fstab/etc/fstab/etc/fstab/etc/fstab/etc/fstab/etc/fstab/etc/fstab/etc/fstab/etc/fstabARGC:命令行参数的个数awk '{print ARGC}’ /etc/fstab /etc/inittab命令本身也是参数的个数awk ‘BEGIN {print ARGC}’ /etc/fstab /etc/inittabARGV:数组,保存的是命令行所给定的各参数awk ‘BEGIN {print ARGV[0]}’ /etc/fstab  /etc/inittabawk ‘BEGIN {print ARGV[1]}’ /etc/fstab /etc/initt{print ARGV[ARGC-1]}BEGIN和ENDBEGIN:模式指定了处理文本之前需要执行的操作END   :模式指定了处理完所有行后执行的操作

-f scripfile 从脚本文件中读取awk命令

   awk -F: -f awk.txt /etc/passwd   awk.txt   {print $1,$3}

格式化输出printf:

printf 必须指定FORMAT,而且不会自动换行,如需换行需在FORMAT内添加 \n,FORMAT中需要分别为后面每个item指定格式符
格式符

%c    : 显示字符的ASCII码%i和%d: 显示十进制整数%e和%E: 显示科学计数法数值%f    : 显示小数点%g和%G: 以科学计算法显示数值%s    :显示字符串%u    :无符号整数%%    : 显示%号自身

修饰符

#[.#] : 第一个数显示正数位数;第二个#表示小数点精度 如%3.1f-     : 左对齐 如:%-15s  (默认是右对齐)+     : 显示数值的正负符号 %+d我们结合BEGIN 和格式符,修饰符进行语法使用[root@localhost ~]#awk -F: 'BEGIN{print "user:--------------------UID:----------------------\n"}{printf "%-23s %-25d \n",$1,$3}' /etc/passwd user:--------------------UID:----------------------root                    0                         bin                     1                         daemon                  2                         adm                     3                         lp                      4    [root@localhost ~]#awk -F: 'BEGIN{print "user:--------------------UID:----------------------\n"}{printf "%-23s %25d \n",$1,$3}END{print "END结尾看看而己"}' /etc/passwd user:--------------------UID:----------------------root                                            0 bin                                             1 daemon                                          2 adm                                             3     ...zhang                                        1000 apache                                         48 END结尾看看而己当我们结合着一起使用时是不是感觉出来了,BEGIN的作用是在awk进行脚本内行间循环处理之前进行操作的,我们也可以在之后加END{语法}进行循环后的操作.

—这里注意一点,当printf使用时 必须指定 FORMAT

[root@localhost ~]#awk -F: 'BEGIN{print "user:--------------------UID:----------------------\n"}{printf "%-23 %25 \n",$1,$3}END{print "END结尾看看而己"}' /etc/passwd  user:--------------------UID:----------------------%25 %25 %25 %25 

位置变量:

$0 , $1 这些在awk不是指的参数,而是指的awk执行操作时每行进行处理的列,$1表示第1列,2...0表示所有列即整行
如:

[root@localhost ~]#awk -F: '{print $1,$2,$3}END{print $0}' /etc/passwdroot x 0bin x 1daemon x 2adm x 3...apache x 48apache:x:48:48:Apache:/usr/share/httpd:/sbin/nologin

匹配模式

1.如果匹配模式为空,则表示匹配每一行2./regular expression/例如: 仅处理只匹配到的行         [root@CentOS ~]# awk -F: '\$NF~/bash\$/{print \$1,\$NF}' /etc/passwd          root /bin/bash3.关系表达式;结果有真有假,当为真时才会被处理如:4.行范围 /pat1/,/pat2/5.BEGIN/END模式BEGIN{}: 仅在开始处理文件中的文本之前执行一次END{} 仅在结束处理文件后文件之后执行一次[root@localhost ~]#awk -F: '($3>=2&&$3<=10){print $1,$3}' /etc/passwd    daemon 2adm 3lp 4sync 5shutdown 6halt 7

常用的action

Expressions —表达式
Contronl Statements : if , while , for 等控制语句
Compound statements : 组合语句
input statements 输入语句
output statments 输出语句

操作符

算术运算操作符

x+y , x-y , x*y , x/y , x^y , x%y ,-x , +y

赋值操作符

 = , +=  ,  -=  ,  /=  ,  %=  ,  ^=  ,  ++  ,  --

比较操作符

\> , >= , < , <= , != , ==

模式匹配符

~:  是否匹配!~: 是否不匹配

逻辑操作符

&& : 与   在awk中表示必须满足与的两个条件 | |   : 或 ! :非

控制语句

if(condition){statements}if(condition)statements else{statement}while(conditon){statements}do {statements} while(conditon)for(expr1;expr2;expr3){statements}break continue exitarray [index] 

单分支if判断例子: if (condition){statements}

[root@localhost ~]#awk -F: '{if($3>=500)print $1,$3}' /etc/passwd   判断打印出uid大于等于500的账号和UIDsystemd-bus-proxy 999polkitd 998unbound 997libstoragemgmt 996colord 995saslauth 994geoclue 993nfsnobody 65534chrony 992setroubleshoot 991gnome-initial-setup 990zhang 1000

多分支if判断列子:if(condition) else{statements}

[root@localhost ~]#awk -F: '{if($3>=1000){printf "普通用户:%-25s\n",$1}else{printf "系统用户: %-25s\n",$1}}' /etc/passwd系统用户: root                     系统用户: bin                      系统用户: daemon                   系统用户: adm       ...               普通用户:zhang                    系统用户: apache   

while循环例子:while(condition)statement
依次显示grub2.cfg以空白字符开头中间任间包含linux16的行的列,并打印出列和列长

[root@localhost ~]#awk  '/^[[:space:]]*linux16/{i=1;while(i<=NF){print $i,length($i);i++}}' /etc/grub2.cfg       linux16 7/vmlinuz-3.10.0-514.el7.x86_64 30root=UUID=241b7f92-047c-4d85-b0b3-2be915811ed5 46ro 2crashkernel=auto 16rhgb 4quiet 5LANG=en_US.UTF-8 16linux16 7/vmlinuz-0-rescue-42b6aa44a83f48efa5f14aeb1eb12c90 50root=UUID=241b7f92-047c-4d85-b0b3-2be915811ed5 46ro 2crashkernel=auto 16rhgb 4quiet 5

我们使用for语句编写上面的例子for(expr1;expr2;expr3){statements}

[root@localhost ~]#awk '/^[[:space:]]*linux16/{for(i=1;i<=NF;i++)print $i,length($i)}' /etc/grub2.cfg  linux16 7/vmlinuz-3.10.0-514.el7.x86_64 30root=UUID=241b7f92-047c-4d85-b0b3-2be915811ed5 46ro 2crashkernel=auto 16rhgb 4quiet 5LANG=en_US.UTF-8 16linux16 7/vmlinuz-0-rescue-42b6aa44a83f48efa5f14aeb1eb12c90 50root=UUID=241b7f92-047c-4d85-b0b3-2be915811ed5 46ro 2crashkernel=auto 16rhgb 4

next
能提前结束对本行的处理,提前进入下次循环;
例:

判断uid余2不等于0的次提前结束行处理和打印等于0的账号和UID[root@localhost ~]#awk -F: '{if($3%2!=0)next;print $1,$3}' /etc/passwdroot 0daemon 2lp 4shutdown 6mail 8games 12ftp 14systemd-network 192polkitd 998libstoragemgmt 996

关联数组

array[index-expression]

1. 可使用任意字符串;字符串要使用双引号2. 如果某数组元素事先不存在,在引用时awk会自动创建此元素,为将其值初始化为“空串”;[root@localhost ~]#awk 'BEGIN{weekdays["mon"]="Monday";weekdays["tue"]="Tuesday";print weekdays["mon"]}'Monday[root@localhost ~]#awk 'BEGIN{weekdays["mon"]="Monday";weekdays["tue"]="Tuesday";print weekdays["tue"]}'Tuesday3.如要遍历数组中的每个元素,要使用for循环 for (var in array ){for-body}[root@localhost ~]#awk 'BEGIN{weekdays["mon"]="Monday";weekdays["tue"]="Tuesday";for(i in weekdays){print weekdays[i]}}'    TuesdayMonday

使用数组例子1:查看端口状态及统计

[root@localhost ~]#netstat -tan |awk '/tcp\>/{i[$NF]++}END{for(j in i)print j,i[j]}'LISTEN 5ESTABLISHED 1[root@localhost ~]#

例子2:计算/etc/fstab内每行单词出现的次数

[root@localhost ~]#awk '{i=1;while(i<=NF){j[$i]++;i++}}END{for(i in j)print i,j[i]}' /etc/fstab     man 1and/or 1UUID=17e5a40c-1872-45ce-807e-b196a3e299b2 1maintained 1xfs 315 1Accessible 1# 7are 1defaults 4blkid(8) 1/ 10 8See 1Sat 1UUID=af4aacb5-abf4-4113-b19b-0542229824f1 1Created 1on 1mount(8) 1anaconda 1fstab(5), 119:44:18 1/app 1/boot 1UUID=a3e1d352-4dc8-4124-857c-367cecd5a86b 1findfs(8), 12017 1UUID=241b7f92-047c-4d85-b0b3-2be915811ed5 1'/dev/disk' 1by 2/etc/fstab 1pages 1more 1info 1swap 2Jul 1filesystems, 1reference, 1for 1under 1[root@localhost ~]#使用for语句[root@localhost ~]#awk '{for(i=1;i<=NF;i++)j[$i]++}END{for(i in j)print i,j[i]}' /etc/fstabman 1and/or 1UUID=17e5a40c-1872-45ce-807e-b196a3e299b2 1maintained 1xfs 315 1Accessible 1# 7are 1defaults 4blkid(8) 1/ 10 8See 1Sat 1UUID=af4aacb5-abf4-4113-b19b-0542229824f1 1Created 1on 1mount(8) 1anaconda 1fstab(5), 119:44:18 1/app 1/boot 1UUID=a3e1d352-4dc8-4124-857c-367cecd5a86b 1findfs(8), 12017 1UUID=241b7f92-047c-4d85-b0b3-2be915811ed5 1'/dev/disk' 1by 2/etc/fstab 1pages 1more 1info 1swap 2Jul 1filesystems, 1reference, 1for 1under 1

数组切片

例: 查看本地访问IP的次数 使用了数组切片

[root@localhost ~]#netstat -tan|awk '/^tcp\>/{split($5,ip,":");count[ip[1]]++}END{for(i in count){print i,count[i]}}'192.168.3.1 10.0.0.0 5[root@localhost ~]#netstat -tan|awk '/^tcp\>/{split($5,ip,":");count[ip[2]]++}END{for(i in count){print i,count[i]}}' * 552563 1[root@localhost ~]#netstat -tan|awk '/^tcp\>/{split($5,ip,":");count[ip[1]]++}END{for(i in count){print i,count[i]}}' 192.168.3.1 10.0.0.0 5[root@localhost ~]#
原创粉丝点击