Linux 命令tr

来源:互联网 发布:java程序员学php 编辑:程序博客网 时间:2024/06/06 05:51

通过使用 tr,您可以非常容易地实现 sed 的许多最基本功能。您可以将 tr 看作为 sed 的(极其)简化的变体:它可以用一个字符来替换另一个字符,或者可以完全除去一些字符。您也可以用它来除去重复字符。这就是所有 tr 所能够做的。 


    tr用来从标准输入中通过替换或删除操作进行字符转换。tr主要用于删除文件中控制字符或进行字符转换。使用tr时要转换两个字符串:字符串1用于查询,字符串2用于处理各种转换。tr刚执行时,字符串1中的字符被映射到字符串2中的字符,然后转换操作开始。
    带有最常用选项的tr命令格式为:
tr -c -d -s ["string1_to_translate_from"]["string2_to_translate_to"] < input-file
这里:
-c 用字符串1中字符集的补集替换此字符集,要求字符集为ASCII。
-d 删除字符串1中所有输入字符。
-s 删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串。
input-file是转换文件名。虽然可以使用其他格式输入,但这种格式最常用。

2、字符范围
指定字符串1或字符串2的内容时,只能使用单字符或字符串范围或列表。
[a-z] a-z内的字符组成的字符串。
[A-Z] A-Z内的字符组成的字符串。
[0-9] 数字串。
\octal 一个三位的八进制数,对应有效的ASCII字符。
[O*n] 表示字符O重复出现指定次数n。因此[O*2]匹配OO的字符串。
tr中特定控制字符的不同表达方式
速记符含义八进制方式
\a Ctrl-G  铃声\007
\b Ctrl-H  退格符\010
\f Ctrl-L  走行换页\014
\n Ctrl-J  新行\012
\r Ctrl-M  回车\015
\t Ctrl-I  tab键\011
\v Ctrl-X  \030

实例:

、将文件file中出现的"abc"替换为"xyz"

 

# cat file | tr "abc""xyz" > new_file

 

【注意】这里,凡是在file中出现的"a"字母,都替换成"x"字母,"b"字母替换为"y"字母,"c"字母替换为"z"字母。而不是将字符串"abc"替换为字符串"xyz"。(,操作的对象是单个字符,可以不连续)

 

2、使用tr命令“统一”字母大小写

(小写 --> 大写)
# cat file | tr [a-z] [A-Z] > new_file

|的名称为管道,含义:将前一个命令cat的结果给后面的命令。其中后面的“>”是文件覆盖所有内容重写的意思,要是文件不存在,则新建此文件。注意>后的文件如果是前面cat命令中的文件,那么此文件会变成一个空文件。(上面的这条命令经过确认,命令中的“|”、“>”与前后元素可以没有空格,但是tr “string1” “string2”三个元素之间必须要有空格,一个或者多个都行))

(大写 --> 小写)
# cat file | tr [A-Z] [a-z] > new_file

 

3、把文件中的数字0-9替换为a-j

 

# cat file | tr [0-9] [a-j] > new_file


4、删除文件file中出现的"Snail"字符

 

# cat file | tr -d "Snail" >new_file

 

【注意】这里,凡是在file文件中出现的'S','n','a','i','l'字符都会被删除!而不是紧紧删除出现的"Snail”字符串。

 

5、删除文件file中出现的换行'\n'、制表'\t'字符

 

# cat file | tr -d "\n\t" >new_file   (,选项-d与前后元素之间必须要有空格)

 

不可见字符都得用转义字符来表示的,这个都是统一的。

 

6、删除“连续着的”重复字母,只保留第一个(,操作对象是单个字符,例如原来的内容为aaaabbbccccdddddaabb,则命令执行后的结果为abcdab

 

# cat file | tr -s [a-zA-Z] > new_file    (,这里的a-zA-Z应该是指字符集为全部大小写字母。如果没有>new_file,则结果直接输出到窗口)

 

7、删除空行

 

# cat file | tr -s "\n" >new_file

 

8、删除Windows文件“造成”的'^M'字符

 

# cat file | tr -d "\r" >new_file      (,\r:匹配一个回车符。等价于\x0d\cM
或者
# cat file | tr -s "\r" "\n" > new_file

 

【注意】这里-s后面是两个参数"\r"和"\n",用后者替换前者

 

9、用空格符\040替换制表符\011   (,这里\040\011中的数值是八进制数,为字符的ASCII码的值)

 

# cat file | tr -s "\011""\040" > new_file     (,这里的tr相当于执行了tr中的2条命令:-s(压缩连续相同字符为1个)、替换:字符"\011"将被 "\040"替换。实际看到的结果的效果是先替换后压缩。但是-s和后面的替换不能交换顺序)

 

10、把路径变量中的冒号":",替换成换行符"\n"

 

# echo $PATH | tr -s ":""\n"      (echo $PATH的作用是显示环境变量值)

 

0 0