Shell命令中的扩展和替换

来源:互联网 发布:《啊哈 算法》epub 编辑:程序博客网 时间:2024/06/04 23:04

Shell命令中的扩展和替换

正则表达式嵌入式BashCC++ 
http://jjz.iteye.com/blog/388946
 
Shell的强大,很大程度上得益于对命令行做了额外的处理,你可以再命令中嵌入其他命令,在参数中嵌入其他命令,或者嵌入变量,插入路径通配符,插入表达式,Shell都能帮你处理的很好,就因为Shell能做这些,所以Shell才如此强大。

 

废话少说,直接开始。

 

首先还是要啰嗦两句,说说Shell处理命令的过程,网上有篇文章写的很不错,很详细,不过我忘记在那儿了,有兴趣的同学可以找找看,用google!我只想说一句:弄清楚Shell处理命令的过程很重要。

 

简单的说下shell处理命令的过程是:

1.先按<tab> <newline> <space> ( ) < > ; l &把命令分割成一个个的token

2.检查第一个token是不是一个开放的关键字,如for if {等,如果是,说明这是一个复合命令,shell会在内部对关键字进行处理,并重复这一步骤。

3.按别名列表检查每个命令的第一个关键字是不是一个别名,如果是别名,则用其别名定义替换,然后回退到第一步。

4.执行花括号{}扩展

5.执行波浪号~扩展

6.执行变量扩展

7.执行命令替换

8.执行算术表达式计算

9.把生成的新命令按IFS分割成token

10.执行路径扩展

11.按优先级查找命令,先从内置,再从PATH。

12.设定好重定向等,执行命令

 

过程大致是这样,这里写的很错略,只是为了帮助更好的了解后文。这里要说的就是4,5,6,7,8,10

 

在Shell中,有六种扩展:花括号、波浪号、变量扩展、命令替换、算术扩展和路径扩展。

 

花括号扩展:

简单点说就是给一组字符串加上相同的前缀和后缀,生成一组新的字符串。前缀和后缀都可以为空。

Shell代码
  1. [jjz@localhost ~]$ echo a{b,c}d   
  2. abd acd   
  3. [jjz@localhost ~]$ echo a{b,c}   
  4. ab ac  

可以使用一个范围,只支持数字和字母。

Shell代码
  1. [jjz@localhost ~]$ echo a{1..10}   
  2. a1 a2 a3 a4 a5 a6 a7 a8 a9 a10   
  3. [jjz@localhost ~]$ echo a{a..f}   
  4. aa ab ac ad ae af  

 

花括号还可以嵌套,逐层有序的进行处理。

Shell代码
  1. [jjz@localhost ~]$ echo a{{1,2},{b,c}}   
  2. a1 a2 ab ac  

 可以认为先生成a{1,2,b,c},然后生成a1 a2 ab ac

要注意的地方:

  1. 花括号里只有字面量,不要试图使用变量,花括号不支持,比如
    Shell代码
    1. [jjz@localhost ~]$ a=1  
    2. [jjz@localhost ~]$ echo {$a..10}   
    3. {1..10}  
     并没有生成1 2 3 4 5 6 7 8 9 10。对大括号扩展来说,生成的结果是{$a..10} ,那为什么我们看到的会是{1..10}呢?这就和Shell的命令处理顺序有关了,我们再看看Shell的命令处理顺序,花括号扩展是在第四步,到了第六步,会执行变量扩展,这时候相当于 命令
    Shell代码
    1. echo {$a..10}  
     $a被替换成了1,当然输出的就是{1..10}了。
  2. 花括号里至少要有一个逗号,也就是至少要有两项
  3. 两项之间不能有空格,也就是逗号前后不能有空格,否则不进行花括号扩展。

波浪号扩展

波浪号扩展就是对~进行处理。一般情况下,我们认为~代表了自己的主目录,其实事情并非这么简单。进行波浪号替换的条件是很苛刻的。

首先,进行波浪号扩展的前提是波浪号必须位于一个token的开头,简单的说,~前面应该是空格。

然后,shell会分析波浪号之后,第一个/或:之前的未被引号括起来的字符串(如果没有/,那就取波浪号之后的所有字符),这个字符串叫做"波浪号前缀(tilde-prefix)"(注意,所谓波浪号前缀其实是出现在波浪号后面的),波浪号前缀的取值和对应的处理方式是:

  1. 如果波浪号前缀是个有效用户名,则波浪号和波浪号前缀一起替换成这个用户的主目录
  2. 如果波浪号前缀为空,则尝试把波浪号替换成HOME,如果HOME没有被设置,则将波浪号替换成当前用户主目录。
  3. 如果波浪号前缀是+,则~+被替换成当前工作目录(PWD)
  4. 如果波浪号前缀是-,则~-被替换成上一个工作目录(OLDPWD)
  5. 如果波浪号前缀是个数字n,则把~n替换成目录堆栈(用dirs命令可以查看目录堆栈)的第n个元素(这个似乎没什么用)

 

Java代码
  1. [jjz@localhost ~]$ echo ~   
  2. /home/jjz   
  3. [jjz@localhost ~]$ echo /~   
  4. /~                                         波浪号不是在token的开头,不进行扩展   
  5. [jjz@localhost ~]$ echo ~root   
  6. /root   
  7. [jjz@localhost ~]$ echo ~root/   
  8. /root/   
  9. [jjz@localhost ~]$ echo ~+   
  10. /home/jjz                               替换成 当前目录   
  11. [jjz@localhost ~]$ echo ~-   
  12. ~-                                          替换成上一个目录,因为我没用过cd,上一个目录OLDPWD没有设置,所谓替换失败,原样输出   
  13. [jjz@localhost ~]$ cd project   
  14. [jjz@localhost project]$ echo ~-        这个好了   
  15. /home/jjz   
  16. [jjz@localhost project]$   

 

变量扩展

这个大家最熟悉了,$foo!$真是个好东西,变量扩展,命令替换,算术扩展都离不了它(当然还能买东西)。一般情况下我们习惯使用$var,其实正规的格式是${var}。前一种形式更简便,后一种更强大,很多时候必须用后一种形式才行。

 

先说说间接引用,这东西很像C语言里的指针。

${!var},就是左花括号后面紧跟一个感叹号。bash会把变量的值作为新的变量再求值。

Shello代码
  1. [jjz@localhost project]$ a=b   
  2. [jjz@localhost project]$ b=1  
  3. [jjz@localhost project]$ echo ${!a}   
  4. 1  

 其他的操作还是列个表出来,看上去可能更清晰

 

形式意义${var:-word}如果变量var已被设置且非空,则代入它的值,否则带入word${var:=word}如果变量var已被设置且空,就带入它的值,否则将var设为word并带入var,位置参量不能用这种方式赋值。${var:+word}如果var已被设置且值非空,带入word;否则什么都不带入(带入空)${var:?word}如果var已被设置且值非空,就带入它的值,否则打印word并退出shell。省略word会输出:parameter null or not set注意:上面word可以是一个变量,使用$word的形式引用其值${var:offset}获取var中offset开始的字串${var:offset:length}获取var中offset开始长为length的字串。注意:上面的offset和length可以使变量,使用$offset,$length引用其值${#var}替换为变量中字符个数,如果var是* ,@或数组,长度则是位置参量的个数。${var%pattern}把字符串尾部与模式进行最小匹配,并删除匹配到的部分。${var%%pattern}把字符串尾部与模式进行最大匹配,并删除匹配到的部分。${var#pattern}把字符串头部与模式进行最小匹配,并删除匹配到的部分。${var##pattern}把字符串头部与模式进行最大匹配,并删除匹配到的部分${var/pattern/string}使用string替换pattern的最大匹配部分。如果pattern以/开头则进行全部替换,否则只替换第一个匹配的位置。如果pattern以#开始,则起始部分必须匹配,如果以%开始则结尾部分必须匹配

注意:

上面的pattern可以使变量,使用$pattern引用其值。

如果var是*、@或数组且以下标为*或@的形式出现,则对其中每一个元素都进行匹配操作。

 

命令替换

 

用命令的输出来替换命令本身。有两种形式$(cmd)和`cmd`,推荐前一种形式,后一种形式是old-style了。这个没什么好说的,很简单。


算术扩展

 

用算术表达式的值替换算术表达式本身。格式$((expr))。expr是个表达式,如4+3。理解起来比较简单。不过关于expression,bash有自己特定的支持,某些运算它是做不了的。

Shell代码
  1. [jjz@localhost project]$ echo $((9+2))   
  2. 11  
  3. [jjz@localhost project]$ b=2  
  4. [jjz@localhost project]$ echo $((4+b))   
  5. 6  
  6. [jjz@localhost project]$   

 

路径扩展

shell扫描每个标记看看是否有*,?和[],这三个就是进行路径扩展的。如果某个标记里出现了三者中的一个或几个,这个标记就被认为是一个模式,shell会对当前目录下的文件列表按文件名排序并逐一与此模式进行比较,如果有匹配这个模式的文件,shell用所有能匹配这个模式的文件名列表替换这个模式。如果没有能匹配这个模式的文件,shell原样保留该模式。当然,shell提供了很多选项,定制匹配成功和失败的处理,还可以选择使用高级的正则表达式,这里不进行讨论,只说说shell的默认情况。此处的三个特殊字符也都比较简单*匹配0到多个字符,?匹配一个字符,[]匹配某个区间里一个字符。