linux shell之sed命令

来源:互联网 发布:mac伴奏降调 编辑:程序博客网 时间:2024/04/30 08:09

sed = stream editor

Sed 命令列可分成编辑指令与文件档部份。其中 , 编辑指令负责控制所有的编辑工作 ; 文件档表示所处理的档案。
sed 的编辑指令均由位址(address)与函数(function)两部份组成 , 其中 , 在执行时 , sed 利用它的位址参数来
决定编辑的对象;而用它的函数参数(解[3])编辑。
此外 , sed 编辑指令 , 除了可在命令列上执行 , 也可在档案内执行。其中差别只是在命令列上执行时 , 其前必
须加上选项 -e ; 而在档案(解[4])内时 , 则只需在其档名前加上选项 -f。另外 , sed 执行编辑指令是依照它
们在命令列上或档内的次序。

下面各节 , 将介绍执行命令列上的编辑指令 、sed 编辑指令、执行档案内的编辑指令、执行多个档案的编辑、及
执行 sed 输出控制。

2.1 执行命令列上的编辑指令
2.2 sed 编辑指令
2.3 执行档案内的编辑指令
2.4 执行多个档案的编辑
2.5 执行 sed 输出控制
2.1.执行命令列上的编辑指令
当编辑指令(参照[section 2.2])在命令列上执行时 , 其前必须加上选项 -e 。其命令格式如下 :
sed -e '编辑指令1' -e '编辑指令2' ... 文件档

其中 , 所有编辑指令都紧接在选项 -e 之後 , 并置於两个 " ' " 特殊字元间。另外 , 命令上编辑指令的执行是由
左而右。

一般编辑指令不多时 , 使用者通常直接在命令上执行它们。例如 , 删除 yel.dat 内 1 至 10 行资料 , 并将其
馀文字中的 "yellow" 字串改成 "black" 字串。此时 , 可将编辑指令直接在命令上执行 , 其命令如下 :

sed -e '1,10d' -e 's/yellow/black/g' yel.dat

在命令中 , 编辑指令 '1,10d'(解[5])执行删除 1 至 10 行资料 ; 编辑指令 's/yellow/black/g'(解[6]) ,
"yellow" 字串替换(substuite)成 "black" 字串。
2.2 sed 的编辑指令
sed 编辑指令的格式如下 :
[address1[,address2]]function[argument]

其中 , 位址参数 address1 、address2 为行数或 regular expression 字串 , 表示所执行编辑的资料行 ; 函数参
数 function[argument] 为 sed 的内定函数 , 表示执行的编辑动作。
下面两小节 , 将仔细介绍位址参数的表示法与有哪些函数参数供选择。

2.2.1 位址(address)参数的表示法
实际上 , 位址参数表示法只是将要编辑的资料行 , 用它们的行数或其中的字串来代替表示它们。下面举几个例子
说明(指令都以函数参数 d(参照[section4.2]) 为例) :
删除档内第 10 行资料 , 则指令为 10d。
删除含有 "man" 字串的资料行时 , 则指令为 /man/d。
删除档内第 10 行到第 200 行资料, 则指令为 10,200d。
删除档内第 10 行到含 "man" 字串的资料行 , 则指令为 10,/man/d。
接下来 , 以位址参数的内容与其个数两点 , 完整说明指令中位址参数的表示法(同样也以函数参数 d 为例)。
位址参数的内容:
位址为十进位数字 : 此数字表示行数。当指令执行时 , 将对符合此行数的资料执行函数参数指示的编辑动作。例如 ,
删除资料档中的第 15 行资料 , 则指令为 15d(参照[section4.2])。其馀类推 ,如删除资料档中的第 m 行资料 , 则
指令为 md 。

位址为 regular expression(参照[附录 A]):
当资料行中有符合 regular expression 所表示的字串时 , 则执行函数参数指示的编辑动作。另外 , 在
regular expression 前後必须加上 "/"
。例如指令为 /t.*t/d , 表示删除所有含两 "t" 字母的资料行。其中 , "."
表示任意字元; "*" 表示其前字元可重任意次 , 它们结合 ".*" 表示两 "t" 字母间的任意字串。

位址参数的个数 : 在指令中 , 当没有位址参数时 , 表示全部资料行执行函数参数所指示的编辑动作; 当只有一位址
参数时 , 表示只有符合位址的资料行才编辑 ; 当有两个位址参数 , 如 address1,address2 时 , 表示对资料区执行
编辑 , address1 代表起始资料行 , address2 代表结束资料行。对於上述内容 , 以下面例子做具说明。

例如指令为

d

其表示删除档内所有资料行。
例如指令为

5d

其表示删除档内第五行资料。
例如指令为

1,/apple/d

其表示删除资料区 , 由档内第一行至内有 "apple" 字串的资料行。
例如指令为

/apple/,/orange/d

其表示删除资料区 , 由档内含有 "apple" 字串至含有 "orange" 字串的资料行
2.2.2 有那些函数(function)参数
下页表中介绍所有 sed 的函数参数(参照[chapter 4])的功能。
函数参数 功能
: label 建立 script file 内指令互相参考的位置。
# 建立解
{ } 集合有相同位址参数的指令。
! 不执行函数参数。
= 印出资料行数( line number )。
a 添加使用者输入的资料。
b label 将执行的指令跳至由 : 建立的参考位置。
c 以使用者输入的资料取代资料。
d 删除资料。
D 删除 pattern space 内第一个 newline 字母 前的资料。
g 拷贝资料从 hold space。
G 添加资料从 hold space 至 pattern space 。
h 拷贝资料从 pattern space 至 hold space 。
H 添加资料从 pattern space 至 hold space 。
l 印出 l 资料中的 nonprinting character 用 ASCII 码。
i 插入添加使用者输入的资料行。
n 读入下一笔资料。
N 添加下一笔资料到 pattern space。
p 印出资料。
P 印出 pattern space 内第一个 newline 字母 前的资料。
q 跳出 sed 编辑。
r 读入它档内容。
s 替换字串。
t label 先执行一替换的编辑指令 , 如果替换成牛p>则将编辑指令跳至 : label 处执行。
w 写资料到它档内。
x 交换 hold space 与 pattern space 内容。
y 转换(transform)字元。
虽然 , sed 只有上表所述几个拥有基本编辑功能的函数 , 但由指令中位址参数和指令与指令间的配合 , 也能使
sed 完成大部份的编辑任务。
2.3 执行档案内的编辑指令
当执行的指令太多 , 在命令列上撰写起来十分混乱 , 此时 , 可将这些指令整理储存在档案
(譬如档名为 script_file )内 , 用选项 -f script_file , 则让 sed 执行 script_file 内的编辑指令。其命
令的格示如下 :
sed -f script_file 文件档

其中 , 执行 script_file 内编辑指令的顺序是由上而下。例如上一节的例子 , 其可改成如下命令:
sed -f ysb.scr yel.dat

其中 , ysb.scr 档的内容如下 :
1,10d
s/yellow/black/g

另外 , 在命令列上可混合使用选项 -e 与 -f , sed 执行指令顺序依然是由命令列的左到右, 如执行至 -f 後
档案内的指令 , 则由上而下执行。


2.4 执行多个文件档的编辑
在 sed 命令列上 , 一次可执行编辑多个文件档 , 它们跟在编辑指令之後。例如 , 替换
white.dat、red.dat、black.dat 档内的 "yellow" 字串成 "blue" , 其命令如下:
sed -e 's/yellow/blue/g' white.dat red.dat black.dat

上述命令执行时 , sed 依 white.dat、red.dat、black.dat 顺序 , 执行编辑指令 s/yellow/blue/(请参照[section 4.1] ,
进行字串的替换。

2.5.执行输出的控制
在命令列上的选项 -n (解[7]) 表示输出由编辑指令控制。由前章内容得知 , sed 会 "自动的" 将资料由
pattern space 输送到标准输出档。但藉着选项 -n , 可将 sed 这 "自动的" 的动作改成 "被动的" 由它所执行的
编辑指令(解[8])来决定结果是否输出。
由上述可知 , 选项 -n 必须与编辑指令一起配合 , 否则无法获得结果。例如 , 印出 white.dat 档内含有 "white"
字串的资料行 , 其命令如下:

sed -n -e '/white/p' white.dat

上面命令中 , 选项 -n 与编辑指令 /white/p (参照[section4.6]) 一起配合控制输出。其中 , 选项 -n 将输出控制权

移给编辑指令;/white/p 将资料行中含有 "white" 字串印出萤幕。


-i选项:直接作用源文件,源文件将被修改。

 

sed命令和选项:

 

a\在当前行后添加一行或多行c\用新文本替换当前行中的文本d删除行i\在当前行之前插入文本h把模式空间的内容复制到暂存缓冲区H把模式空间的内容添加到缓冲区g取出暂存缓冲区的内容,将其复制到模式缓冲区G取出暂存缓冲区的内容,将其追加到模式缓冲区l列出非打印字符p打印行n读入下一行输入,并从下一条而不是第一条命令对其处理q结束或退出sedr从文件中读取输入行!对所选行以外的行应用所有命令s用一个字符串替换另外一个字符串

 

 

 

替换标志:

 

g在行内进行全局替换p打印行w将行写入文件x交换暂存缓冲区和模式空间的内容y将字符转换成另外一个字符

 

 

sed例子:

 

打印:p命令

 

sed ‘/abc/p’ file

打印file中包含abc的行。默认情况sed把所有行都打印到屏幕,如果某行匹配到模式,则把该行另外再打印一遍

sed  -n ‘/abc/p’ file和上面一样,只是去掉了sed的默认行为,只会打印匹配的行

 

 

删除:d命令

 

sed ‘3,$d’ file   删除从第3行到最后一行的内容。sed ‘$d’ file删除最后一行的内容sed ‘/abc/d’删除包含abc的行。sed ‘3d’ file删除第三行的内容

 

 

替换:s命令

 

sed  ‘s/abc/def/g’ file把行内的所有abc替换成def,如果没有g,则只替换行内的第一个abcsed  -n ‘s/abc/def/p’ file只打印发生替换的那些行sed  ‘s/abc/&def/’ file在所有的abc后面添加def(&表示匹配的内容)sed  -n ‘s/abc/def/gp’ file把所有的abc替换成def,并打印发生替换的那些行sed  ‘s#abc#def#g’ file把所有的abc替换成def,跟在替换s后面的字符就是查找串和
替换串之间的分割字符,本例中试#

 

 

指定行的范围:逗号

 

sed  -n ‘/abc/,/def/p’ file打印模式abc到def的行sed  -n ‘5/,/def/p’ file打印从第五行到包含def行之间的行。sed /abd/,/def/s/aaa/bbb/g修改从模式abc到模式def之间的行,把aaa替换成def

 

 

多重编辑-e

 

sed  -e ‘1,3d’ -e ‘s/abc/def/g’ file删除1-3行,然后把其余行的abc替换成def

 

 

读文件:r命令

 

sed  ‘/abc/r newfile’ file在包含abc的行后读入newfile的内容

 

 

写文件:w命令  

 

sed  ‘/abc/w newfile’ file在包含abc的行写入newfile

 

 

追加:a命令     

 

sed  ‘/abc/a\def’ file在包含abc的行后新起一行,写入def

 

 

插入:i命令     

 

sed  ‘/abc/i\def’ file在包含abc的行前新起一行,写入def

 

 

修改:c命令   

 

sed  ‘/abc/c\def’ file在包含abc的行替换成def,旧文本被覆盖

 

 

读取下一行:n命令  

 

sed  ‘/abc/{n ; s/aaa/bbb/g;}’ file读取包含abc的行的下一行,替换aaa为bbb

 

 

转换:y命令       

 

sed  ‘y/abc/ABC’ file将a替换成A,b替换成B,c替换成C(正则表达式元字符不起作用)

 

 

退出:q命令   

 

sed  ‘/abc/{ s/aaa/bbb/ ;q; }’ file在某行包含了abc,把aaa替换成bbb,然后退出sed。

 

 

暂存和取用:h命令(把模式行存储到暂存缓冲区)和g(取出暂存缓冲区的行并覆盖模式缓冲区)G(取出临时缓冲区的行)命令 

 

h和g是复制行为(覆盖),H和G表示追加。    

sed  -e ‘/abc/h’  -e ‘$G’ file包含abc的行通过h命令保存到暂存缓冲区,在第二条命令汇中,sed读到最后一行$时,G命令从暂存缓冲区中读取一行,追加到模式缓冲区的后面。即所有包含abc的行的最后一行被复制到文件末尾。sed -e ‘/abc/{h; d;}’
      -e  ‘/def/{g; }’ file包含abc的行会移到包含def的行上,并进行覆盖。

 

 

暂存和互换:h和x命令    

 

sed  -e ‘/abc/h’ 
-e ‘/def/x’ file包含abc的行会被换成def的行。