Linux命令行与shell脚本(16)--gawk使用

来源:互联网 发布:渗透理论 复杂网络 编辑:程序博客网 时间:2024/06/05 22:35

gawk

  • gawk通常用来从大文本文件中提取数据元素并将它们格式化成可度的报告
  • Crtl+D组合键能终止gawk程序并返回到命令行界面提示符下
  • gawk读取文本文件并显示第1数据字段值 gawk -F: '{print $1}' /etc/passwd
  • gawk允许将程序存储到文件中
$ cat script1 {print $1}$ gawk -F: -f script1 /etc/passwd
  • gawk在读取数据前执行BEGIN关键字后指定的程序脚本
gawk -F: 'BEGIN { print "Hello World"} {print $1}' /etc/passwd
  • gawk在读取数据之后执行END关键字后指定的程序脚本
gawk -F: '{print $1} END {print "end file"}' /etc/passwd
  • 使用FS与OFS
$ cat datadata11 data12 data13 data14 data15 data21 data22 data23 data24 data25 data31 data32 data33 data34 data35 $ gawk 'BEGIN{FS=" "; OFS="-"}{print $1,$2,$3}' datadata11-data12-data13data21-data22-data23data31-data32-data33
  • 一旦设置了FIELDWIDTH变量,gawk就会忽略FS变量,而根据提供的字段宽度大小来计算字段
  • RS用来指定行分隔符
  • NF变量允许你指定数据行中的最后一个数据字段,而不用知道它的具体位置
gawk 'BEGIN{FS=":"; OFS=":"}{print $1,$NF}' /etc/passwd
  • 匹配操作符允许你将正则表达式限定在数据行中的特定数据段
$ cat data1data11,data12,data13,data14,data15data21,data22,data23,data24,data25data31,data32,data33,data34,data35$ gawk 'BEGIN{FS=","} $2 ~ /^data2/{print $0}' data1
0 0