转义字符引发的血案(hive、bash)

来源:互联网 发布:欧阳娜娜家庭 知乎 编辑:程序博客网 时间:2024/05/17 20:36
hive hql:从一个字符串“p?a?b?c?ppp?hhh”中以?作为分隔符,找第5段字符串

bash程序:
test.sh
#!/bin/bashhive -e "select (split('p?a?b?c?ppp?hhh','?'))[4]  from a limit 1;"

报错:
Caused by: java.util.regex.PatternSyntaxException: Dangling meta character '?' near index 0修改成:
test.sh
#!/bin/bashhive -e "select (split('p?a?b?c?ppp?hhh','\\\\?'))[4]  from a limit 1;"
正确运行原因:
split的第二个参数是一个regex,而‘?’有特殊的意义(? 零次或一次匹配前面的字符或子表达式),因此需要被转义。在hive中,'\'本身就代表转义字符,因此'\'需要被转义在bash中,'\'本身就代表转义字符,因此'\'需要被转义附录:正则表达式需要转义的特殊字符注释 $ 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,那么 $ 还匹配 \n 或 \r 前面的位置。若要匹配 $ 字符本身,请使用 \$。( ) 标记子表达式的开始和结束。可以捕获子表达式以供以后使用。若要匹配这两个字符,请使用 \( 和 \)。* 零次或多次匹配前面的字符或子表达式。若要匹配 * 字符,请使用 \*。+ 一次或多次匹配前面的字符或子表达式。若要匹配 + 字符,请使用 \+。. 匹配除换行符 \n 之外的任何单个字符。若要匹配 .,请使用 \。 [ ] 标记中括号表达式的开始。若要匹配这些字符,请使用 \[ 和 \]。? 零次或一次匹配前面的字符或子表达式,或指示“非贪心”限定符。若要匹配 ? 字符,请使用 \?。\ 将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如,字符 n 匹配字符 n。\n 匹配换行符。序列 \\ 匹配 \,序列 \( 匹配 (。/ 表示文本正则表达式的开始或结束。若要匹配 / 字符,请使用 \/。^ 匹配输入字符串开始处的位置,但在中括号表达式中使用的情况除外,在那种情况下它对字符集求反。若要匹配 ^ 字符本身,请使用 \^。{ } 标记限定符表达式的开始。若要匹配这些字符,请使用 \{ 和 \}。| 指出在两个项之间进行选择。若要匹配 | ,请使用 \| 
bash转义字符表\a            ASCII 响铃字符(也可以键入 \007) \d            "Wed Sep 06" 格式的日期 \e            ASCII 转义字符(也可以键入 \033) \h            主机名的第一部分(如 "mybox") \H            主机的全称(如 "mybox.mydomain.com") \j            在此 shell 中通过按 ^Z 挂起的进程数 \l            此 shell 的终端设备名(如 "ttyp4") \n            换行符 \r            回车符 \s            shell 的名称(如 "bash") \t            24 小时制时间(如 "23:01:01") \T            12 小时制时间(如 "11:01:01") \@            带有 am/pm 的 12 小时制时间 \u            用户名 \v            bash 的版本(如 2.04) \V            Bash 版本(包括补丁级别) \w            当前工作目录(如 "/home/drobbins") \W            当前工作目录的“基名 (basename)”(如 "drobbins") \!            当前命令在历史缓冲区中的位置 \#            命令编号(只要您键入内容,它就会在每次提示时累加) \$            如果您不是超级用户 (root),则插入一个 "$";如果您是超级用户,则显示一个 "#" \xxx            插入一个用三位数 xxx(用零代替未使用的数字,如 "\007")表示的 ASCII 字符 \\            反斜杠 \[            这个序列应该出现在不移动光标的字符序列(如颜色转义序列)之前。它使 bash 能够正确计算自动换行。 \]            这个序列应该出现在非打印字符序列之后。reference:http://www.aslibra.com/blog/read.php/1559.htmhttp://hi.baidu.com/yacker/item/52af3ca4c94873d35bf191ea
原创粉丝点击