bash 进阶之变量替换与字符串操作

来源：互联网发布：notes plus 知乎编辑：程序博客网时间：2024/05/21 00:20

分类：

摘自《高级bash脚本编程指南》

变量替换

处理和(或)扩展变量

${parameter}

与$parameter相同, 也就是变量parameter的值. 在某些上下文中, ${parameter}很少会产生混淆.

可以把变量和字符串组合起来使用.

      1 your_id=${USER}-on-${HOSTNAME}      2 echo "$your_id"      3 #      4 echo "Old \$PATH = $PATH"      5 PATH=${PATH}:/opt/bin  #在脚本的生命周期中, /opt/bin会被添加到$PATH变量中.      6 echo "New \$PATH = $PATH"

${parameter-default}, ${parameter:-default}

${parameter-default} — 如果变量parameter没被声明, 那么就使用默认值.

${parameter:-default} — 如果变量parameter没被设置, 那么就使用默认值.
注：“（没）被声明”与“（没）被设置”在是否有 “:” 号的句式差别中仅仅是触发点的不同而已。“被声明”的触发点显然要比“被设置”的要低，“被设置”是在“被声明”的基础上而且不能赋值（设置）为空（没有赋值/设置为空）。

      1 echo ${username-`whoami`}      2 # 如果变量$username还没有被声明, 那么就echo出`whoami`的结果(译者注: 也就是把'whoami'的结果赋值给变量$username).

注：${parameter-default} 和${parameter:-default}在绝大多数的情况下都是相同的. 只有在parameter已经被声明, 但是被赋null值得时候, 这个额外的 : 才会产生不同的结果.

  1 #!/bin/bash  2 # param-sub.sh  3  4 #  一个变量是否被声明或设置,  5 #+ 将会影响这个变量是否使用默认值,  6 #+ 即使这个变量值为空(null).  7  8 username0=  9 echo "username0 has been declared, but is set to null." 10 echo "username0 = ${username0-`whoami`}" 11 # 不会有输出. 12 13 echo 14 15 echo username1 has not been declared. 16 echo "username1 = ${username1-`whoami`}" 17 # 将会输出默认值. 18 19 username2= 20 echo "username2 has been declared, but is set to null." 21 echo "username2 = ${username2:-`whoami`}" 22 #                            ^ 23 # 会输出, 因为:-会比-多一个条件测试. 24 # 可以与上边的例子比较一下. 25 26 27 # 28 29 # 再来一个: 30 31 variable= 32 # 变量已经被声明, 但是设为空值. 33 34 echo "${variable-0}"    # (没有输出) 35 echo "${variable:-1}"   # 1 36 #               ^ 37 38 unset variable 39 40 echo "${variable-2}"    # 2 41 echo "${variable:-3}"   # 3 42 43 exit 0

如果脚本并没有接收到来自命令行的参数, 那么默认参数结构将会提供一个默认值给脚本.

  1 DEFAULT_FILENAME=generic.data  2 filename=${1:-$DEFAULT_FILENAME} #对 $1 设置默认值  3 #  如果没有指定值, 那么下面的代码块将会使用filename  4 #+ 变量的默认值"generic.data".  5 #  6 #  后续的命令.

${parameter=default}, ${parameter:=default}

${parameter=default} — 如果变量parameter没被声明, 那么就把它的值设为default.

${parameter:=default} — 如果变量parameter没被设置, 那么就把它的值设为default.

这两种形式基本上是一样的. 只有在变量$parameter被声明并且被设置为null值的时候, : 才会引起这两种形式的不同. 如上边所示.

      1 echo ${username=`whoami`}      2 # 变量"username"现在被赋值为`whoami`.

${parameter+alt_value}, ${parameter:+alt_value}

${parameter+alt_value} — 如果变量parameter被声明了, 那么就使用alt_value, 否则就使用null字符串.

${parameter:+alt_value} — 如果变量parameter被设置了, 那么就使用alt_value, 否则就使用null字符串.

这两种形式绝大多数情况下都一样. 只有在parameter被声明并且设置为null值的时候, 多出来的这个 : 才会引起这两种形式的不同, 具体请看下边的例子.

  1 echo "###### \${parameter+alt_value} ########"  2 echo  3  4 a=${param1+xyz}  5 echo "a = $a"      # a =  6  7 param2=  8 a=${param2+xyz}  9 echo "a = $a"      # a = xyz 10 11 param3=123 12 a=${param3+xyz} 13 echo "a = $a"      # a = xyz 14 15 echo 16 echo "###### \${parameter:+alt_value} ########" 17 echo 18 19 a=${param4:+xyz} 20 echo "a = $a"      # a = 21 22 param5= 23 a=${param5:+xyz} 24 echo "a = $a"      # a = 25 # 产生与a=${param5+xyz}不同的结果. 26 27 param6=123 28 a=${param6:+xyz} 29 echo "a = $a"      # a = xyz

${parameter?err_msg}, ${parameter:?err_msg}

${parameter?err_msg} — 如果parameter被声明了, 那么就使用设置的值, 否则打印err_msg错误消息.

${parameter:?err_msg} — 如果parameter被设置了, 那么就使用设置的值, 否则打印err_msg错误消息.

这两种形式绝大多数情况都是一样的. 和上边所讲的情况一样, 只有在parameter被声明并设置为null值的时候, 多出来的 : 才会引起这两种形式的不同.

例子 1. 使用参数替换和错误消息

  1 #!/bin/bash  2  3 #  检查一些系统环境变量.  4 #  这是一种可以做一些预防性保护措施的好习惯.  5 #  比如, 如果$USER(用户在控制台上中的名字)没有被设置的话,  6 #+ 那么系统就会不认你.  7  8 : ${HOSTNAME?} ${USER?} ${HOME?} ${MAIL?}  9   echo 10   echo "Name of the machine is $HOSTNAME." 11   echo "You are $USER." 12   echo "Your home directory is $HOME." 13   echo "Your mail INBOX is located in $MAIL." 14   echo 15   echo "If you are reading this message," 16   echo "critical environmental variables have been set." 17   echo 18   echo 19 20 # ------------------------------------------------------ 21 22 #  ${variablename?}结构 23 #+ 也能够检查脚本中变量的设置情况. 24 25 ThisVariable=Value-of-ThisVariable 26 #  注意, 顺便提一下, 27 #+ 这个字符串变量可能会被设置一些非法字符. 28 : ${ThisVariable?} 29 echo "Value of ThisVariable is $ThisVariable". 30 echo 31 echo 32 33 34 : ${ZZXy23AB?"ZZXy23AB has not been set."} 35 #  如果变量ZZXy23AB没有被设置的话, 36 #+ 那么这个脚本会打印一个错误信息, 然后结束. 37 38 # 你可以自己指定错误消息. 39 # : ${variablename?"ERROR MESSAGE"} 40 41 42 # 等价于:    dummy_variable=${ZZXy23AB?} 43 #            dummy_variable=${ZZXy23AB?"ZXy23AB has not been set."} 44 # (dummy 的意思是“虚设的、假的、名义上的”) 45 #            echo ${ZZXy23AB?} >/dev/null 46 （me:到这里俺终于明白特殊符号 ":" 在一个二元命令中提供一个占位符和默认参数的意思了。确切来说是明白了所谓的“二元命令”指啥了，扯远了，^_^）      1 : ${username=`whoami`}      2 # ${username=`whoami`}   如果没有开头的":"的话, 将会给出一个错误,      3 #                        除非"username"是一个命令或者内建命令... 47 #  使用命令"set -u"来比较这些检查变量是否被设置的方法. 48 # 49 50 51 52 echo "You will not see this message, because script already terminated." 53 54 HERE=0 55 exit $HERE   # 不会在这里退出. 56 57 # 事实上, 这个脚本将会以返回值1作为退出状态(echo $?).

例子 2. 参数替换和”usage”消息(译者注: 通常就是帮助信息)

  1 #!/bin/bash  2 # usage-message.sh  3  4 : ${1?"Usage: $0 ARGUMENT"}  5 #  如果没有提供命令行参数的话, 那么脚本就在这里退出了,  6 #+ 并且打印如下错误消息.  7 #    usage-message.sh: 1: Usage: usage-message.sh ARGUMENT  8  9 echo "These two lines echo only if command-line parameter given." 10 echo "command line parameter = \"$1\"" 11 12 exit 0  # 如果提供了命令行参数, 那么脚本就会在这里退出. 13 14 # 分别检查有命令行参数时和没有命令行参数时, 脚本的退出状态. 15 # 如果有命令行参数, 那么"$?"就是0. 16 # 如果没有的话, 那么"$?"就是1.

参数替换与(或)扩展.

下边这些表达式都是对如何在expr字符串操作中进行match的补充. 这些特定的使用方法一般都用来解析文件所在的目录名.

变量长度/子串删除

${#var}

字符串长度(变量$var得字符个数). 对于array来说, ${#array}表示的是数组中第一个元素的长度.

例外情况:

${#*}和${#@}表示位置参数的个数.
对于数组来说, ${#array[*]}和${#array[@]}表示数组中元素的个数.

例子 3. 变量长度

  1 #!/bin/bash  2 # length.sh  3  4 E_NO_ARGS=65  5  6 if [ $# -eq 0 ]  # 这个演示脚本必须有命令行参数. 特殊变量 $# 表示命令行参数的个数。  7 then  8   echo "Please invoke this script with one or more command-line arguments."  9   exit $E_NO_ARGS 10 fi 11 12 var01=abcdEFGH28ij 13 echo "var01 = ${var01}" 14 echo "Length of var01 = ${#var01}" 15 # 现在, 让我们试试在变量中嵌入一个空格. 16 var02="abcd EFGH28ij" 17 echo "var02 = ${var02}" 18 echo "Length of var02 = ${#var02}" 19 20 echo "Number of command-line arguments passed to script = ${#@}" 21 echo "Number of command-line arguments passed to script = ${#*}" 22 23 exit 0

${var#Pattern}, ${var##Pattern}

从变量 $var 的开头删除最短或最长匹配 $Pattern 的子串. (译者注: 这是一个很常见的用法, 请读者牢记, 一个”#”表示匹配最短, “##”表示匹配最长.)

用法示例:

  1 # 摘自例子"days-between.sh"的一个函数.  2 # 去掉传递进来参数开头的0.  3  4 strip_leading_zero () #  去掉从参数中传递进来的,  5 {                     #+ 可能存在的开头的0(也可能有多个0).  6   return=${1#0}       #  "1"表示的是"$1" -- 传递进来的参数.  7 }                     #  "0"就是我们想从"$1"中删除的子串 -- 去掉零.

另一个用法示例:

  1 echo `basename $PWD`        # 当前工作目录的basename(就是去掉目录名).  2 echo "${PWD##*/}"           # 当前工作目录的basename(就是去掉目录名).  3 echo  4 echo `basename $0`          # 脚本名字.  5 echo $0                     # 脚本名字.  6 echo "${0##*/}"             # 脚本名字."0" 表示 "$0"  7 echo  8 filename=test.data  9 echo "${filename##*.}"      # data 10                             # 文件扩展名.

${var%Pattern}, ${var%%Pattern}

从变量 $var 的结尾删除最短或最长匹配 $Pattern 的子串. (译者注: 这是一个很常见的用法, 请读者牢记, 一个”%”表示匹配最短, “%%”表示匹配最长.)

例子 4. 修改文件扩展名:

  1 #!/bin/bash  2 # rfe.sh: 修改文件扩展名.  3 #  4 # 用法:rfe old_extension new_extension  5 #  6 # 示例:  7 # 将指定目录中所有的*.gif文件都重命名为*.jpg,  8 # 用法:rfe gif jpg  9 10 11 E_BADARGS=65 12 13 case $# in 14   0|1)             # 竖线"|"在这里表示"或"操作. 15   echo "Usage: `basename $0` old_file_suffix new_file_suffix" 16   exit $E_BADARGS  # 如果只有0个或1个参数的话, 那么就退出脚本. 17   ;; 18 esac 19 20 21 for filename in *.$1 22 # 以第一个参数为扩展名的全部文件的列表. 23 do 24   mv $filename ${filename%$1}$2 25   #  把筛选出来的文件的扩展名去掉, 因为筛选出来的文件的扩展名都是第一个参数, 26   #+ 然后把第2个参数作为扩展名, 附加到这些文件的后边. 27 done 28 29 exit 0

变量扩展/子串替换 这些结构都是从ksh中引入的.

${var:pos}

变量var从位置pos开始扩展(译者注: 也就是pos之前的字符都丢弃).
${var:pos:len}

变量var从位置pos开始, 并扩展len个字符.
${var/Pattern/Replacement}

使用Replacement来替换变量var中第一个匹配 Pattern 的字符串.

如果省略Replacement, 那么第一个匹配Pattern的字符串将被替换为空, 也就是被删除了.
${var//Pattern/Replacement}

全局替换. 所有在变量var匹配Pattern的字符串, 都会被替换为Replacement.

和上边一样, 如果省略Replacement, 那么所有匹配Pattern的字符串, 都将被替换为空, 也就是被删除掉.

（Pattern 为正则表达式）

例子 5. 使用模式匹配来解析任意字符串

  1 #!/bin/bash  2  3 var1=abcd-1234-defg  4 echo "var1 = $var1"  5  6 t=${var1#*-*}  7 echo "var1 (with everything, up to and including first - stripped out) = $t"  8 #  t=${var1#*-}  也一样,  9 #+ 因为#匹配最短的字符串, 10 #+ 同时*匹配任意前缀, 包括空字符串. （上面的语句执行后 $t 的值为 "123-defg"） 11 # (感谢, Stephane Chazelas, 指出这点.) 12 13 t=${var1##*-*} 14 echo "If var1 contains a \"-\", returns empty string...   var1 = $t" 15 16 17 t=${var1%*-*} 18 echo "var1 (with everything from the last - on stripped out) = $t" 19 20 echo 21 22 # ------------------------------------------- 23 path_name=/home/bozo/ideas/thoughts.for.today 24 # ------------------------------------------- 25 echo "path_name = $path_name" 26 t=${path_name##/*/} 27 echo "path_name, stripped of prefixes = $t" 28 # 在这个特例中, 与t=`basename $path_name`效果相同. 29 #  t=${path_name%/}; t=${t##*/}   是更一般的解决方法. 30 #+ 但有时还是会失败. 31 #  如果$path_name以一个换行符结尾的话, 那么`basename $path_name` 就不能正常工作了, 32 #+ 但是上边的表达式可以. 33 # (感谢, S.C.) 34 35 t=${path_name%/*.*} 36 # 与t=`dirname $path_name`效果相同. 37 echo "path_name, stripped of suffixes = $t" 38 # 在某些情况下将失效, 比如 "../", "/foo////", # "foo/", "/". 39 #  删除后缀, 尤其是在basename没有后缀的情况下, 40 #+ 但是dirname可以, 不过这同时也使问题复杂化了. 41 # (感谢, S.C.) 42 43 echo 44 45 t=${path_name:11} # bash 的索引从 “0” 开始计数 46 echo "$path_name, with first 11 chars stripped off = $t" 47 t=${path_name:11:5} 48 echo "$path_name, with first 11 chars stripped off, length 5 = $t" 49 50 echo 51 52 t=${path_name/bozo/clown} 53 echo "$path_name with \"bozo\" replaced  by \"clown\" = $t" 54 t=${path_name/today/} 55 echo "$path_name with \"today\" deleted = $t" 56 t=${path_name//o/O} 57 echo "$path_name with all o's capitalized = $t" 58 t=${path_name//o/} 59 echo "$path_name with all o's deleted = $t" 60 61 exit 0

${var/#Pattern/Replacement}

如果变量var的前缀匹配Pattern, 那么就使用Replacement来替换匹配到Pattern的字符串.
${var/%Pattern/Replacement}

如果变量var的后缀匹配Pattern, 那么就使用Replacement来替换匹配到Pattern的字符串.

例子 6. 对字符串的前缀和后缀使用匹配模式

  1 #!/bin/bash  2 # var-match.sh:  3 # 对字符串的前缀和后缀进行模式替换的一个演示.  4  5 v0=abc1234zip1234abc    # 变量原始值.  6 echo "v0 = $v0"         # abc1234zip1234abc  7 echo  8  9 # 匹配字符串的前缀(开头). 10 v1=${v0/#abc/ABCDEF}    # abc1234zip1234abc 11                         # |-| 12 echo "v1 = $v1"         # ABCDEF1234zip1234abc 13                         # |----| 14 15 # 匹配字符串的后缀(结尾). 16 v2=${v0/%abc/ABCDEF}    # abc1234zip123abc 17                         #              |-| 18 echo "v2 = $v2"         # abc1234zip1234ABCDEF 19                         #               |----| 20 21 echo 22 23 #  ---------------------------------------------------- 24 #  必须匹配字符串的开头或结尾, 25 #+ 否则是不会产生替换结果的. 26 #  ---------------------------------------------------- 27 v3=${v0/#123/000}       # 匹配, 但不是在开头. 28 echo "v3 = $v3"         # abc1234zip1234abc 29                         # 不会发生替换. 30 v4=${v0/%123/000}       # 匹配, 但不是在结尾. 31 echo "v4 = $v4"         # abc1234zip1234abc 32                         # 不会发生替换. 33 34 exit 0

${!varprefix*}, ${!varprefix@}

匹配所有之前声明过的, 并且以varprefix开头的变量.

      1 xyz23=whatever      2 xyz24=      3      4 a=${!xyz*}      # 展开所有以"xyz"开头的, 并且之前声明过的变量名.      5 echo "a = $a"   # a = xyz23 xyz24      6 a=${!xyz@}      # 同上.      7 echo "a = $a"   # a = xyz23 xyz24      8      9 # Bash, 版本2.04, 添加了这个功能.

字符串操作

Bash所支持的字符串操作的数量多的令人惊讶. 但是不幸的是, 这些工具缺乏统一的标准. 一些是参数替换的子集, 而另外一些则受到UNIX expr命令的影响. 这就导致了命令语法的不一致, 还会引起冗余的功能, 但是这些并没有引起混乱.

字符串长度

${#string}

expr length $string

expr “$string” : ‘.*’

匹配字符串开头的子串长度

expr match “$string” ‘$substring’

$substring是一个正则表达式.
expr “$string” : ‘$substring’

$substring是一个正则表达式.

  1 stringZ=abcABC123ABCabc  2 #       |------|  3  4 echo `expr match "$stringZ" 'abc[A-Z]*.2'`   # 8  5 echo `expr "$stringZ" : 'abc[A-Z]*.2'`       # 8

索引

expr index $string $substring

在字符串$string中所匹配到的$substring第一次所出现的位置.

提取子串

${string:position}

在$string中从位置$position开始提取子串.

如果$string是”*”或者”@”, 那么将会提取从位置$position开始的位置参数. （这适用于命令行参数或函数参数.）
${string:position:length}

在$string中从位置$position开始提取$length长度的子串.

  1 stringZ=abcABC123ABCabc  2 #       0123456789.....  3 #       0-based indexing.  4  5 echo ${stringZ:0}                            # abcABC123ABCabc  6 echo ${stringZ:1}                            # bcABC123ABCabc  7 echo ${stringZ:7}                            # 23ABCabc  8  9 echo ${stringZ:7:3}                          # 23A 10                                              # 提取子串长度为3. 11 12 13 14 # 能不能从字符串的右边(也就是结尾)部分开始提取子串? 15 16 echo ${stringZ:-4}                           # abcABC123ABCabc 17 # 默认是提取整个字符串, 就象${parameter:-default}一样. 18 # 然而 . . . 19 20 echo ${stringZ:(-4)}                         # Cabc 21 echo ${stringZ: -4}                          # Cabc 22 # 这样, 它就可以工作了. 23 # 使用圆括号或者添加一个空格可以"转义"这个位置参数. 24 25 # 感谢, Dan Jacobson, 指出这点.

如果$string参数是”*”或”@”, 那么将会从$position位置开始提取$length个位置参数, 但是由于可能没有$length个位置参数了, 那么就有几个位置参数就提取几个位置参数.

  1 echo ${*:2}          # 打印出第2个和后边所有的位置参数.  2 echo ${@:2}          # 同上.  3  4 echo ${*:2:3}        # 从第2个开始, 连续打印3个位置参数.

expr substr $string $position $length

在$string中从$position开始提取$length长度的子串.

      1 stringZ=abcABC123ABCabc      2 #       123456789......      3 #       以1开始计算.      4      5 echo `expr substr $stringZ 1 2`              # ab      6 echo `expr substr $stringZ 4 3`              # ABC

expr match “$string” ‘$$substring$’

从$string的开始位置提取$substring, $substring是正则表达式.
expr “$string” : ‘$$substring$’

从$string的开始位置提取$substring, $substring是正则表达式.

      1 stringZ=abcABC123ABCabc      2 #       =======      3      4 echo `expr match "$stringZ" '\(.[b-c]*[A-Z]..[0-9]\)'`   # abcABC1      5 echo `expr "$stringZ" : '\(.[b-c]*[A-Z]..[0-9]\)'`       # abcABC1      6 echo `expr "$stringZ" : '\(.......\)'`                   # abcABC1      7 # 上边的每个echo都打印出相同的结果.

expr match “$string” ‘.*$$substring$’

从$string的结尾提取$substring, $substring是正则表达式.
expr “$string” : ‘.*$$substring$’

从$string的结尾提取$substring, $substring是正则表达式.

      1 stringZ=abcABC123ABCabc      2 #                ======      3      4 echo `expr match "$stringZ" '.*\([A-C][A-C][A-C][a-c]*\)'`    # ABCabc      5 echo `expr "$stringZ" : '.*\(......\)'`                       # ABCabc

子串削除

${string#substring}

从$string的开头位置截掉最短匹配的$substring.
${string##substring}

从$string的开头位置截掉最长匹配的$substring.
${string%substring}

从$string的结尾位置截掉最短匹配的$substring.
${string%%substring}

从$string的结尾位置截掉最长匹配的$substring.

当你需要构造文件名的时候, 这个操作就显得特别有用.(例如更改文件后缀名（格式）等)

子串替换

${string/substring/replacement}

使用$replacement来替换第一个匹配的$substring.
${string//substring/replacement}

使用$replacement来替换所有匹配的$substring.
${string/#substring/replacement}

如果$substring匹配$string的开头部分, 那么就用$replacement来替换$substring.
${string/%substring/replacement}

如果$substring匹配$string的结尾部分, 那么就用$replacement来替换$substring.