linux awk学习

来源:互联网 发布:淘宝如何搜电棍 编辑:程序博客网 时间:2024/05/16 13:57
基本结构如下:
awk 'BEGIN{ print "start" } pattern {commands } END {print "end"} '
这三部份是可选的。且脚本通常会被包含在单引号或者双引号中:
[root@localhost test]# cat test.sh| wc -l
6
[root@localhost test]# awk 'BEGIN{ i=0 } { i++ } END { print i }' test.sh
6
[root@localhost test]# awk "BEGIN{ i=0 } { i++ } END { print i }" test.sh
6

awk的工作原理如下:
(1)执行BEGIN {command}
(2)从文件或stdin中读取一行,执行pattern {command}。重复该过程,直到文件全部被读取完毕。
(3)当读到输入流末尾时,执行END{command}语句块。
这三部份是可选的哈。
如果没有(2)部份,则执行默认的 { print },即打印每一读到的行。
如:
[root@localhost test]# echo -e "line1\nline2" | awk 'BEGIN{print "Start"} {print} END {print "End"}'
Start
line1
line2
End
其中echo 的-e选项,是将\n转换为换行符,请自己man 一下。
[root@localhost test]# echo | awk '{var1="v1"; var2="v2"; var3="v3"; print var1,var2,var3}'
v1 v2 v3
[root@localhost test]# echo | awk '{var1="v1"; var2="v2"; var3="v3"; print var1"-"var2"-"var3}'
v1-v2-v3
{}类似于一个循环,会对文件中的每一行进行迭代

awk中的特殊变量:
NR:表示记录数量,执行过程中对应于当前行号。
NF:表示字段数量,执行过程中对应于当前的字段数。
$0:包含执行过程中当前行的全部文本内容。
$1:包含第一个字段的文本内容
$2:包含第二个字段的文本内容
$(NF-1)包含倒数第二个字段。
例:
[root@localhost test]# cat student.data 
NO;     Name;   Mark
1;      lufubo; 98
2;      cbiao;  88
[root@localhost test]# awk '{print $2,$3}' student.data 
Name; Mark
lufubo; 98
cbiao; 88
统计行数:
[root@localhost test]# cat student.data | wc -l
3
[root@localhost test]# awk 'END{print NR}' student.data 
3

awk 的选项
-v:将外部变量传递给awk
例:
[root@localhost test]# VAR=100
[root@localhost test]# echo | awk -v V=$VAR '{print V}'
100

awk用getline读取行:
[root@localhost test]# seq 5 | awk 'BEGIN { getline; print "first line", $0} {print $0}'
first line 1
2
3
4
5

awk的过滤:
awk 'NR < 5'行号小于5的行
awk 'NR==1, NR==4'行号在1到4的行
awk '/linux/'包含linux样式的行
awk '!/linux/'不包含linux样式的行
[root@localhost test]# seq 5 | awk 'NR < 3 {print $0}' 
1
2
[root@localhost test]# seq 5 | awk 'NR==2,NR==3 {print $0}' 
2
3
[root@localhost test]# echo -e "linux\nlufubo\n" | awk '/linux/ {print $0}' 
linux
[root@localhost test]# echo -e "linux\nlufubo\n" | awk '!/linux/ {print $0}' 
lufubo

awk设置字符定界符
默认为空格,通过 -F “delimiter”设置
[root@localhost test]# awk -F":" '{print $NF}' /etc/passwd
[root@localhost test]# awk 'BEGIN {FS = ":"} {print $NF}' /etc/passwd

从awk中读取命令输出
“command” | getline output;
[root@localhost test]# echo | awk '{"grep root /etc/passwd" | getline cmdout; print cmdout}'
root:x:0:0:root:/root:/bin/bash
注意其中的双引号哟~^~

打印处于start_pattern与end_pattern 之间的文本
[root@localhost test]# seq 100 | awk '/34/, /35/'
34
35

原创粉丝点击