Shell命令中的扩展和替换

来源：互联网发布：《啊哈算法》epub 编辑：程序博客网时间：2024/06/04 23:04

Shell命令中的扩展和替换

正则表达式嵌入式BashCC++

http://jjz.iteye.com/blog/388946

Shell的强大，很大程度上得益于对命令行做了额外的处理，你可以再命令中嵌入其他命令，在参数中嵌入其他命令，或者嵌入变量，插入路径通配符，插入表达式，Shell都能帮你处理的很好，就因为Shell能做这些，所以Shell才如此强大。

废话少说，直接开始。

首先还是要啰嗦两句，说说Shell处理命令的过程，网上有篇文章写的很不错，很详细，不过我忘记在那儿了，有兴趣的同学可以找找看，用google！我只想说一句：弄清楚Shell处理命令的过程很重要。

简单的说下shell处理命令的过程是：

1.先按<tab> <newline> <space> ( ) < > ; l &把命令分割成一个个的token

2.检查第一个token是不是一个开放的关键字，如for if {等，如果是，说明这是一个复合命令，shell会在内部对关键字进行处理，并重复这一步骤。

3.按别名列表检查每个命令的第一个关键字是不是一个别名，如果是别名，则用其别名定义替换，然后回退到第一步。

4.执行花括号{}扩展

5.执行波浪号~扩展

6.执行变量扩展

7.执行命令替换

8.执行算术表达式计算

9.把生成的新命令按IFS分割成token

10.执行路径扩展

11.按优先级查找命令，先从内置，再从PATH。

12.设定好重定向等，执行命令

过程大致是这样，这里写的很错略，只是为了帮助更好的了解后文。这里要说的就是4,5,6,7,8,10

在Shell中，有六种扩展：花括号、波浪号、变量扩展、命令替换、算术扩展和路径扩展。

花括号扩展：

简单点说就是给一组字符串加上相同的前缀和后缀，生成一组新的字符串。前缀和后缀都可以为空。

Shell代码

[jjz@localhost ~]$ echo a{b,c}d
abd acd
[jjz@localhost ~]$ echo a{b,c}
ab ac

[jjz@localhost ~]$ echo a{b,c}dabd acd[jjz@localhost ~]$ echo a{b,c}ab ac

可以使用一个范围，只支持数字和字母。

Shell代码

[jjz@localhost ~]$ echo a{1..10}
a1 a2 a3 a4 a5 a6 a7 a8 a9 a10
[jjz@localhost ~]$ echo a{a..f}
aa ab ac ad ae af

[jjz@localhost ~]$ echo a{1..10}a1 a2 a3 a4 a5 a6 a7 a8 a9 a10[jjz@localhost ~]$ echo a{a..f}aa ab ac ad ae af

花括号还可以嵌套，逐层有序的进行处理。

Shell代码

[jjz@localhost ~]$ echo a{{1,2},{b,c}}
a1 a2 ab ac

[jjz@localhost ~]$ echo a{{1,2},{b,c}}a1 a2 ab ac

可以认为先生成a{1,2,b,c}，然后生成a1 a2 ab ac

要注意的地方：

花括号里只有字面量，不要试图使用变量，花括号不支持，比如
Shell代码
1. [jjz@localhost ~]$ a=1
2. [jjz@localhost ~]$ echo {$a..10}
3. {1..10}
```
[jjz@localhost ~]$ a=1[jjz@localhost ~]$ echo {$a..10}{1..10}
```
并没有生成1 2 3 4 5 6 7 8 9 10。对大括号扩展来说，生成的结果是{$a..10} ，那为什么我们看到的会是{1..10}呢？这就和Shell的命令处理顺序有关了，我们再看看Shell的命令处理顺序，花括号扩展是在第四步，到了第六步，会执行变量扩展，这时候相当于命令
Shell代码
1. echo {$a..10}
```
echo {$a..10}
```
$a被替换成了1，当然输出的就是{1..10}了。
花括号里至少要有一个逗号，也就是至少要有两项
两项之间不能有空格，也就是逗号前后不能有空格，否则不进行花括号扩展。

波浪号扩展

波浪号扩展就是对~进行处理。一般情况下，我们认为~代表了自己的主目录，其实事情并非这么简单。进行波浪号替换的条件是很苛刻的。

首先，进行波浪号扩展的前提是波浪号必须位于一个token的开头，简单的说，~前面应该是空格。

然后，shell会分析波浪号之后，第一个/或:之前的未被引号括起来的字符串（如果没有/，那就取波浪号之后的所有字符），这个字符串叫做"波浪号前缀(tilde-prefix)"（注意，所谓波浪号前缀其实是出现在波浪号后面的），波浪号前缀的取值和对应的处理方式是：

如果波浪号前缀是个有效用户名，则波浪号和波浪号前缀一起替换成这个用户的主目录
如果波浪号前缀为空，则尝试把波浪号替换成HOME，如果HOME没有被设置，则将波浪号替换成当前用户主目录。
如果波浪号前缀是+，则~+被替换成当前工作目录(PWD)
如果波浪号前缀是-，则~-被替换成上一个工作目录(OLDPWD)
如果波浪号前缀是个数字n，则把~n替换成目录堆栈(用dirs命令可以查看目录堆栈)的第n个元素（这个似乎没什么用）

Java代码

[jjz@localhost ~]$ echo ~
/home/jjz
[jjz@localhost ~]$ echo /~
/~ 波浪号不是在token的开头，不进行扩展
[jjz@localhost ~]$ echo ~root
/root
[jjz@localhost ~]$ echo ~root/
/root/
[jjz@localhost ~]$ echo ~+
/home/jjz 替换成当前目录
[jjz@localhost ~]$ echo ~-
~- 替换成上一个目录，因为我没用过cd，上一个目录OLDPWD没有设置，所谓替换失败，原样输出
[jjz@localhost ~]$ cd project
[jjz@localhost project]$ echo ~- 这个好了
/home/jjz
[jjz@localhost project]$

[jjz@localhost ~]$ echo ~/home/jjz[jjz@localhost ~]$ echo /~/~                                         波浪号不是在token的开头，不进行扩展[jjz@localhost ~]$ echo ~root/root[jjz@localhost ~]$ echo ~root//root/[jjz@localhost ~]$ echo ~+/home/jjz                               替换成 当前目录[jjz@localhost ~]$ echo ~-~-                                          替换成上一个目录，因为我没用过cd，上一个目录OLDPWD没有设置，所谓替换失败，原样输出[jjz@localhost ~]$ cd project[jjz@localhost project]$ echo ~-        这个好了/home/jjz[jjz@localhost project]$

变量扩展

这个大家最熟悉了，$foo！$真是个好东西，变量扩展，命令替换，算术扩展都离不了它（当然还能买东西）。一般情况下我们习惯使用$var，其实正规的格式是${var}。前一种形式更简便，后一种更强大，很多时候必须用后一种形式才行。

先说说间接引用，这东西很像C语言里的指针。

${!var}，就是左花括号后面紧跟一个感叹号。bash会把变量的值作为新的变量再求值。

Shello代码

[jjz@localhost project]$ a=b
[jjz@localhost project]$ b=1
[jjz@localhost project]$ echo ${!a}
1

[jjz@localhost project]$ a=b[jjz@localhost project]$ b=1[jjz@localhost project]$ echo ${!a}1

其他的操作还是列个表出来，看上去可能更清晰

形式意义${var:-word}如果变量var已被设置且非空，则代入它的值，否则带入word${var:=word}如果变量var已被设置且空，就带入它的值，否则将var设为word并带入var，位置参量不能用这种方式赋值。${var:+word}如果var已被设置且值非空，带入word；否则什么都不带入(带入空)${var:?word}如果var已被设置且值非空，就带入它的值，否则打印word并退出shell。省略word会输出：parameter null or not set注意：上面word可以是一个变量，使用$word的形式引用其值${var:offset}获取var中offset开始的字串${var:offset:length}获取var中offset开始长为length的字串。注意：上面的offset和length可以使变量，使用$offset,$length引用其值${#var}替换为变量中字符个数，如果var是* ，@或数组，长度则是位置参量的个数。${var%pattern}把字符串尾部与模式进行最小匹配，并删除匹配到的部分。${var%%pattern}把字符串尾部与模式进行最大匹配，并删除匹配到的部分。${var#pattern}把字符串头部与模式进行最小匹配，并删除匹配到的部分。${var##pattern}把字符串头部与模式进行最大匹配，并删除匹配到的部分${var/pattern/string}使用string替换pattern的最大匹配部分。如果pattern以/开头则进行全部替换，否则只替换第一个匹配的位置。如果pattern以#开始，则起始部分必须匹配，如果以%开始则结尾部分必须匹配

注意：

上面的pattern可以使变量，使用$pattern引用其值。

如果var是*、@或数组且以下标为*或@的形式出现，则对其中每一个元素都进行匹配操作。

命令替换

用命令的输出来替换命令本身。有两种形式$(cmd)和`cmd`，推荐前一种形式，后一种形式是old-style了。这个没什么好说的，很简单。

算术扩展

用算术表达式的值替换算术表达式本身。格式$((expr))。expr是个表达式，如4+3。理解起来比较简单。不过关于expression，bash有自己特定的支持，某些运算它是做不了的。

Shell代码

[jjz@localhost project]$ echo $((9+2))
11
[jjz@localhost project]$ b=2
[jjz@localhost project]$ echo $((4+b))
6
[jjz@localhost project]$

[jjz@localhost project]$ echo $((9+2))11[jjz@localhost project]$ b=2[jjz@localhost project]$ echo $((4+b))6[jjz@localhost project]$

路径扩展

shell扫描每个标记看看是否有*,?和[]，这三个就是进行路径扩展的。如果某个标记里出现了三者中的一个或几个，这个标记就被认为是一个模式，shell会对当前目录下的文件列表按文件名排序并逐一与此模式进行比较，如果有匹配这个模式的文件，shell用所有能匹配这个模式的文件名列表替换这个模式。如果没有能匹配这个模式的文件，shell原样保留该模式。当然，shell提供了很多选项，定制匹配成功和失败的处理，还可以选择使用高级的正则表达式，这里不进行讨论，只说说shell的默认情况。此处的三个特殊字符也都比较简单*匹配0到多个字符，?匹配一个字符，[]匹配某个区间里一个字符。