sed命令详解(上)

来源:互联网 发布:弱视治疗软件 编辑:程序博客网 时间:2024/06/11 04:32
本文编辑整理自:http://apps.hi.baidu.com/share/detail/35034009
一、简介
sed是一种在线编辑器,它一次处理一行内容。处理时sed会把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用命令脚本处理缓冲区中的内容,处理完成后把缓冲区的内容输出到屏幕,继续处理下一行,这样不断重复直到文件末尾。这一过程中文件内容并没有改变,除非你使用重定向存储输出,或者使用GNU sed命令的 -i 选项(PS:即inline edit,行内编辑)。
本文介绍的是Gnu版本的Sed 4.2.1
二、语法
Usage: sed [OPTION]... {script-only-if-no-other-script} [input-file]...
  -n, --quiet, --silent
                 suppress automatic printing of pattern space
  -e script, --expression=script
                 add the script to the commands to be executed
  -f script-file, --file=script-file
                 add the contents of script-file to the commands to be executed
  --follow-symlinks
                 follow symlinks when processing in place
  -i[SUFFIX], --in-place[=SUFFIX]
                 edit files in place (makes backup if extension supplied)
  -l N, --line-length=N
                 specify the desired line-wrap length for the `l' command
  --posix
                 disable all GNU extensions.
  -r, --regexp-extended
                 use extended regular expressions in the script.
  -s, --separate
                 consider files as separate rather than as a single continuous
                 long stream.
  -u, --unbuffered
                 load minimal amounts of data from the input files and flush
                 the output buffers more often
      --help     display this help and exit
      --version  output version information and exit

If no -e, --expression-f, or --file option is given, then the first
non-option argument is taken as the sed script to interpret.  All
remaining arguments are names of input files; if no input files are
specified, then the standard input is read.
选项-n
该选项等同于--quiet和--silent选项。该选项就让sed用命令脚本处理缓冲区中的内容后,默认设置不把缓冲区的内容输出到屏幕。
选项-e
该选项用于指定一条要执行的sed命令脚本。如果我们不使用该选项的话,就只能执行一条sed命令脚本-e script等同于--expression=script
选项-f
该选项用于指定一个要执行的sed命令脚本文件
选项--help
打印sed的帮助信息
选项--version
打印当前sed的版本号
三、命令脚本
sed一次处理一行内容。处理时sed会把当前处理的行存储在临时缓冲区中,接着用命令脚本处理缓冲区中的内容,处理完成后把缓冲区的内容输出到屏幕,继续处理下一行,这样不断重复直到文件末尾。命令脚本包括命令命令参数替换标记元字符集。命令和命令参数直接用"/"进行分割,同时命令参数之间也用"/"进行分割。
3.1、确定编辑范围
默认情况下,sed会对文件所有的行都进行处理,但是我们可以在命令脚本中指定要处理的行的范围。可以直接通过行号来指定你要编辑的行的范围;逗号分隔的两个行号表示以这两行为起止的行的范围(包括行数表示的那两行)。如1,3表示1,2,3行,美元符号($)表示最后一行。另外,还可以通过元字符集正则表达式或者二者结合的方式确定要编辑的行的范围 。
3.2、基本命令
如果基本命令不是在命令脚本之首的话,需要在其前面加上“/”以表明其是命令。
a\        在当前行后面加入一行文本。
b lable   分支到脚本中带有标记的地方,如果分支不存在则分支到脚本的末尾。
c\        用新的文本改变本行的文本。
        从模板块(Pattern space)位置删除行。
D         删除模板块的第一行。
i\        在当前行上面插入文本。
h         拷贝模板块的内容到内存中的缓冲区。
H         追加模板块的内容到内存中的缓冲区
g         获得内存缓冲区的内容,并替代当前模板块中的文本。
G         获得内存缓冲区的内容,并追加到当前模板块文本的后面。
l         列表不能打印字符的清单。
n         读取下一个输入行,用下一个命令处理新的行而不是用第一个命令。
N         追加下一个输入行到模板块后面并在二者间嵌入一个新行,改变当前行号码。
p         打印模板块的行。
P         打印模板块的第一行。
q          退出Sed。
r file         从file中读行。
w file        写并追加模板块到file末尾。
W file       写并追加模板块的第一行到file末尾。
t label       if分支,从最后一行开始,条件一旦满足或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
T label     错误分支,从最后一行开始,一旦发生错误或者T,t命令,将导致分支到带有标号的命令处,或者到脚本的末尾。
!                     表示后面的命令对所有没有被选定的行发生作用。
s/re/string       用string替换正则表达式re。
=                     打印当前行号码。
                     把注释扩展到下一个换行符以前。
3.3、替换标记
以下的是替换标记:
g            表示行内全面替换。默认的是只替换第一个。
p            表示打印行。
           表示把行写入一个文件。
x            表示互换模板块中的文本和缓冲区中的文本。
y            表示把一个字符翻译为另外的字符(但是不用于正则表达式)
3.4、元字符集
元字符集主要用于行匹配和字符匹配。
^           锚定行的开始 如:/^sed/表示所有以sed开头的。 
$          锚定行的结束 如:/sed$/匹配所有以sed结尾的。 
          匹配一个非换行符的字符 如:/s.d/表示s后接一个任意字符(非换行符),然后是d。 
*           匹配零或多个字符 如:/*sed/匹配所有模板是一个或多个空格后紧跟sed的行。 
[]          匹配一个指定范围内的字符,如/[Ss]ed/匹配sed和Sed。 
[^]         匹配一个不在指定范围内的字符,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一个字母开头,紧跟ed的。 
\(..\)      保存匹配的字符,如s/\(love\)able/\1rs,loveable被替换成lovers。 
&          保存搜索字符用来替换其他字符,如s/love/**&**/,love被替换成**love**。 
\<         锚定单词的开始,如:/\<love/匹配包含以love开头的单词的。 
\>         锚定单词的结束,如/love\>/匹配包含以love结尾的单词的。 
x\{m\}    重复字符x,m次,如:/0\{5\}/匹配包含5个o的。 
x\{m,\}   重复字符x,至少m次,如:/o\{5,\}/匹配至少有5个o的。 
x\{m,n\}  重复字符x,至少m次,不多于n次,如:/o\{5,10\}/匹配5--10个o的
原创粉丝点击