[转载]sed命令替换换行符

来源:互联网 发布:运用大数据的案例分析 编辑:程序博客网 时间:2024/05/17 10:38

sed流编辑器是shell中处理文本内容的一大利器。sed命令从文本流中读取一行文本到模式空间中进行相应的命令、或脚本处理,因此在处理换行符时会有点特殊。

下面的命令可以很正确的执行:

?
1
echo"a,b,c,d" |sed's/,/\n/g'
但是如果我想恢复回来,下面的命令却没有效果了:
?
1
echo"a,b,c,d" |sed's/,/\n/g'|sed's/\n/,/g'
这跟sed的行处理方式有关,sed读取一行时,会先把换行符去掉,处理完后再添加上,所以是无法使用上面的命令进行换行符替换的,必须使用sed中的其它命令来完成。上面的恢复可以使用tr命令:
?
1
echo"a,b,c,d" |sed's/,/\n/g'|tr-t '\n'','

下面是网上找到的一些用法,经实践效果是各不相同的,只有一种是完全可行的。

?
1
sed':label;N;s/\n/:/;b label' filename
?
1
sed':label;N;s/\n/:/;t label' filename
上面的两条命令可以实现将文件中的所有换行符替换为指定的字串,如命令中的冒号。命令的解释:
  • :label;  这是一个标签,用来实现跳转处理,名字可以随便取(label),后面的b label就是跳转指令
  • N;  N是sed的一个处理命令,追加文本流中的下一行到模式空间进行合并处理,因此是换行符可见
  • s/\n/:/;   s是sed的替换命令,将换行符替换为冒号
  • b label  或者 t label    b / t 是sed的跳转命令,跳转到指定的标签处

标签跳转和N的追加命令实现了每一行的不间断放入模式处理空间,从而不会漏掉每一个换行符,而没有标签的话跳转的话,就只能每两行替换掉一个换行符,对比效果:

?
1
2
3
4
5
echo"a,b,c,d" |sed's/,/\n/g'|sed':x;N;s/\n/,/;b x'
a,b,c,d
echo"a,b,c,d" |sed's/,/\n/g'|sed'N;s/\n/,/'
a,b
c,d
还有如下的一种命令的处理效果,也是无法实现换行符的替换。事实上$符号在sed中表示文本流中的最后一行,下面的处理结果我并不是很理解。
?
1
2
3
4
5
$  echo"a,b,c,d" |sed's/,/\n/g'|sed's/$/,/'
a,
b,
c,
d,

PS:sed中的n命令和~地址表示

?
1
sed'8,80{n;n;n;d}' filename
n表示读取文本流中的下一行到模式空间(N为追加),sed还是只处理一行。上面的命令理解:从第8行起(包含),一次读取9/10/11行,然后读取11行后,执行d命令,就是删除处理空间中的第11行,之后从12行开始,读取13/14/15, 删除15行,以此类推,直到第80行。
?
1
sed'11~4d' filename

该命令实现和上一个命令同样的功能,唯一的差别就是它直到文件结束,而无法指定结束行。


原文地址:http://my.oschina.net/shelllife/blog/118337

0 0