awk工具

来源:互联网 发布:java泛型常用的地方 编辑:程序博客网 时间:2024/05/20 06:25

awk

awk是一种文本分析工具,相对于grep的查找,sed的编辑。awk和sed都可以处理文本,awk比sed的强大之处在于处理列也是比较细致的,它可以对行(记录)、列(域)进行分析。awk默认的行分隔符是换行,列分隔符是Tab或者连续的空格(列分隔符分开的每个部分称为一个域)。

  • awk命令行的基本形式:
    awk option ‘script’ file1 file2 …
    awk option -f scriptfile file1 file2 …
  • awk编辑命令的格式:
    /pattern/{actions}

awk有三种调用方式:命令行方式、shell脚本方式以及将所有的awk命令插入一个文本中运行。

一、awk的命令行操作

  • 简单的命令行操作

正则匹配
格式:awk ‘/pattern/{action}’
表示与正则表达式pattern匹配时执行相应的action
例如:下图是打印满足以’prodectC’开头的商品价格
这里写图片描述

条件匹配
(1)格式:awk [-F field_separator] ‘command’ file
command是awk命令,-F指定了以什么作为分割符(根据这个选项也可以自己定义分隔符),在不指明的情况下,默认的域分隔符是空格(-F的使用在后边讲)。
举例:有file文件:
这里写图片描述
打印文件的第一列
这里写图片描述
这里要说明一下:$0表示一整行的内容,$1表示第一列,$2表示第二列…..
(2)格式:awk ‘condiation{action}’ file
表示当满足条件condiation时执行action。仍然用上述的file举例:
打印价钱高于123的商品名:
这里写图片描述

BEGIN{},END{}标签
awk处理文本分三个阶段:处理文本前->处理中->处理文本后,BEGIN执行的是执行之前的动作,END执行的是处理之后的动作。
其工作流程是:限制性BEGIN,然后按行读取文件,每次读取一条记录后,将记录按照指定的域分隔符分开并填充域。当所有的记录读取完后就执行END。

这里写图片描述

二、shell脚本方式

awk也可以像执行shell脚本的方式来运行。将所有的awk命令插入一个文件,并使文件可执行,然后将awk命令解释器作为脚本的首行,并通过键入脚本名称来调用。
举例:打印上述file文件中不同价格区间的商品数量:
这里写图片描述

三、awk命令插入一个文件运行

将所有的awk命令插入一个单独文件,然后调用。需要注意的是,在写脚本时,我们需要将shebang写成”#!/bin/awk”,类似于写shell脚本时的”#!/bin/bash”
格式:awk -f awk-script-file files
-f选项加载awk-script-file中的awk脚本,files指定要处理的文本
例如:打印file文件中不同价格区间的商品数量:
这里写图片描述

四、awk的内置变量

awk有许多内置变量用来设置环境信息,这些变量可以被改变,下面给出了最常用的一些变量。

ARGC               命令行参数个数ARGV               命令行参数排列ENVIRON            支持队列中系统环境变量的使用FILENAME           awk浏览的文件名FNR                浏览文件的记录数FS                 设置输入域分隔符,等价于命令行 -F选项NF                 浏览记录的域的个数NR                 已读的记录数OFS                输出域分隔符ORS                输出记录分隔符RS                 控制记录分隔符

举例:输出file文件每一行的域的个数(默认以空格为分隔符)
这里写图片描述

五、awk是类C的

  • print 和 printf函数
    print:参数可以是变量、数值或字符串,字符串必须用双引号引用,参数之间用逗号隔开
    printf:用法和C类似,可格式化输出。当输出复杂时,printf会更好用一些
    举例1:统计每行域的个数
    这里写图片描述

举例2:以name:xx count: xx pro:xx 格式统计file文件的内容
这里写图片描述

  • 循环语句与条件判断
    awk的循环可以使用BEGIN{} END{}标签实现,当然也可以用类C的while/for循环实现
    举例1:统计/etc/passwd下的账户人数
    这里写图片描述

举例2:使用while循环输出满足条件的file中的内容
这里写图片描述

条件判断的举例参考第二部分:shell方式运行awk

1 0
原创粉丝点击