sed命令详解

来源:互联网 发布:什么是云计算服务 编辑:程序博客网 时间:2024/06/04 19:54
Sed是一个非交互性上下文编辑器,它被设计用来在以下环境中发挥作用:
1.可以直接操作或编辑那些对常规编辑器而言太大的文件。相信很多人都有过打打开一个大文件会拖死你的电脑的情况;
2.编辑命令太复杂(windows上貌似不存在这种情况,用命令行的linux就难说了)很难以在交互模式下编辑文件;
3.要在对输入的一趟扫描中有效的进行多个‘全局’(global)编辑函数

在开始介绍sed的控制符与语法之前,先概述几个概念
四个空间:
input stream, pattern buffer, output stream 和 hold buffer
基本操作过程:
将 input stream 的当前行放入 pattern buffer, 然后 input stream 的指针指向下一行 ;对 pattern buffer 中的行进行处理 ;将上面的处理结果放入 output stream. 然后循环这个过程.
hold buffer是另一个空间 , 可以通过命令和 pattern buffer 进行交互 .

Sed命令介绍

一: 基本命令:字符串替换:’s’
1.基本用法:
e.g. sed ’s/day/night/’ new
该例子将文件 old 中的每一行第一次出现的 day 替换成 night, 将结果输出到文件 new
对上述例子的说明:
s 表示替换命令
/../../ 分割符 (Delimiter),第一个/../表示要搜索的字符或正则表达式,也就是上面例子中的’day’;第二个/../表示要用来替换的字符串,也就是上面例子中的’night’

2.用 & 表示匹配的字符串
有时可能会想在匹配到的字符串周围或附近加上一些其它的字符,那么可以像下面这样来操作:
sed ’s/abc/(abc)/’ new
该例子从old文件中读取字符,在找到的 abc 前后加上括号,然后写回文件new。该例子还可以写成
sed ’s/abc/(&)/’ new #效果和上面的一样
下面是更复杂的例子 :
sed ’s/[a-z]*/(&)/’ new
sed ’s/[0-9]*/& &/’ new

3.用 \1, \2, …, \9 来表示匹配的字符串
先看个例子:
sed ’s/\([a-z]*\)[0-9]*/\1/g’ new #本例中 \1 就是指前面的 \([a-z]*\)
#如果在old文件中有内容:abc123 abc123那么在new文件中将会是:abc abc

\1, \2, …, \9 也可以出现在搜索字符串中,例如:
sed ’s/\([a-z]*\) \1/\1/’ new #本例可以去除重复的由字母组成的词

4.替换选项
4.1 /g 替换所有的
sed 默认只替换搜索字符串的第一次出现 , 利用 /g 可以替换搜索字符串所有出现的地方, 例如:
sed ’s/\([^ ]*\)/(&)/g’ new

4.2 用 /1, /2, … 来表明替换哪一次出现
sed ’s/[^ ]*//2′ new #替换搜索到的第二次出现,可以从 /1 用到 /512

4.3 /p print 选项
当 sed 命令有 -n 选项时 , 该命令没有输出,例如,
sed -n ’s/\([a-z]*\)[0-9]*/\1/’ 但是如果-n 配合 /p 选项后, 如果该行确实发生了替换 , 则输出该行, 否则不输出。

4.4 ‘/w filename’ 输出写到文件 filename 中
sed ’s/\([0-9]*\) \([a-z]*\)/\2/w new’ 该例子把输出放入文件new 中

5.替换和插入换行符号
替换换行符
(echo a;echo x;echo y) | sed ‘/x$/ {N;s:x\n:x:}’
输出:
a
xy
说明:{ }将多个命令组成一个命令集,命令间用分号分割
插入换行符
(echo a;echo x;echo y) | sed ’s:x:X\
:’
输出:
a
X

y

二:只对特定行的处理
1.通过行号限定
sed ‘3 s/[0-9][0-9]*//’ new 只处理第 3 行
sed ‘1,100 s/A/a/’ new 只处理 1 到 100 行
sed ‘101,$ s/A/a/’ new 处理 101 到文件的最后一行
sed ‘101,$ !s/A/a/’ new 这里 ! 表示只对 1 到 100 行进行替换 ,! 的作用 是取反

2. 通过正规表达式限定
sed ‘/start/,/stop/ s/#.*//’ new
本例中 ,sed 先找到有 start 的行作为开始 , 找到最近的有 stop 的行作为结束 , 对之间的行进行操作,重复上述过程 , 直到文件结束。

下面这个例子是行号和正规表达式配合来限定:
sed ‘1,/start/ s/#.*//’ new 对第 1 行到含有 start 的行进行处理

三:其他的简单命令
1.删除命令: d
sed ‘11,$ d’ new 删除从 11 行到文件末尾
sed ‘/^#/ d’ new 删除所有以 # 开始的行
2.print 命令 p (注意 与上面提到的和 s 命令结合使用的 /p 选项的区别)
sed ‘p’ sed -n ‘p’ sed ‘/^$/ p’ sed -n ‘1,10 p’ sed -n ‘/match/ p’ 3.quit 命令: q
sed ‘11 q’注意 :q 命令不能接收多行 , 例如:
sed ‘2,5 q’4.写入文件命令: w filename( 注意与 s 命令的 /w 选项的区别 )
sed -n ‘/^[0-9]*[02468]/ w even’ 5.输出行号命令: =
sed -n ‘/PATTERN/ =’ 6.追加 , 改变 , 插入新行
追加命令 a:
#!/bin/sh
sed ‘
/WORD/ a\
Add this line after every line with WORD‘

改变命令 c
#!/bin/sh
sed ‘
/WORD/ c\
Replace the current line with the line‘

插入命令 i
#!/bin/sh
sed ‘
/WORD/ i\
Add this line before every line with WORD‘

7.变换命令: y
sed ‘y/abcdef/ABCDEF/’ 8.将本行的控制符也显示出来的命令: l
sed ‘1,10 l’ 9.d 命令和 D 命令
d 命令删除 pattern buffer 中的内容进入下一次操作循环
D 命令删除 pattern buffer 中第一个换行符之前的内容进入下一次操作循环 , 如果 pattern buffer 中还有内容 , 则不用从 input stream 中读入。
10.p 命令和 P 命令
p 命令输出 pattern buffer 中的内容
P 命令输出 pattern buffer 中第一个换行符之前的内容
11.n 命令和 N 命令
n 命令把下一行读入 pattern buffer 中 ( 如果没用 -n 选项 , 将原来行输出 )
N 命令把下一行追加到 pattern buffer 中
12.流程控制命令
b label 命令 : 在指定行跳到 label
t label 命令 : 如果在某行发生了替换 , 跳到 label
T label 命令 : 如果在某行没有发生了替换 , 跳到 label

四:调用 sed 时的参数
1.-e script: 执行 script 这个脚本
e.g. sed -e ’s/a/A/’ -e ’s/b/B/’ new
对每一行分别执行 ’s/a/A/’ 和 ’s/b/B/’
2.-n: 禁止输出
这里的 -n 与前面的 /p 配合 , 可以只输出被修改了的行 .
3.-f scriptname 把 scriptname 文件中的 sed 命令加入本次 sed 的调用中
e.g. sed -f sedscript new
sedscript 的内容可能是这样的:
# sed comment – This script changes lower case vowels to upper case
s/a/A/g
s/e/E/g
s/i/I/g
s/o/O/g
s/u/U/g

五:Hold Buffer
x 命令 : 将 pattern buffer 放入 hold buffer, 而将 hold buffer 的内容输出 , pattern buffer 的内容变成下一行
h 命令 : 将 pattern buffer 放入 hold buffer, 并将 pattern buffer 的内容输出, pattern buffer 的内容变成下一行
H 命令 : 将 pattern buffer 追加到 hold buffer
g 和 G 命令 :g 用 hold buffer 的内容替换 pattern buffer 的内容 , 而 G 将 hold buffer 内容追加到 pattern buffer
原创粉丝点击