perl 匹配特殊字符

来源:互联网 发布:samsung gear软件下载 编辑:程序博客网 时间:2024/06/05 06:57
上面三条正则表达式都隐藏着另一个陷阱。假如用户输入的是字串hello :-),就会导致严重的运行时错误。变量内插后得到的实际正则表达式会从/($pat){2}/变为/(hello :-)){2}/,不光是毫无意义,连括号也不对称了。Perl会报告正则表达式错在哪里:

Unmatched ) in regex; marked by <-- HERE in
  m/(hello :-)) <-- HERE {2}/

  这种问题我们可以用qr//解决(见条款40)。
  对于括号、星号、点号之类的特殊字符,如果不想把它们作为正则表达式元字符使用,可以借助quotemeta操作符,或是转义操作符\Q。quotemeta和\Q会在任何不是字母、数字及下划线的字符之前加上反斜线作转义处理。
  下面的代码从标准输入读取字串,使用quotemeta将字符中的特殊字符转义,然后再用于匹配。如果输入仍旧是hello :-),那么转义后会变为hello\ \:\-\),可以放心地用这个正则表达式进行匹配了。

chomp( $pat = <STDIN> );
my $quoted = quotemeta $pat;
print "matched\n" if /($quoted){2}/;

  或者,直接在表达式中使用转义操作符\Q和\E :

chomp( $pat = <STDIN> );
print "matched\n" if /(\Q$pat\E){2}/;

  跟使用正则表达式的其他语法结构一样,一点点疏忽都可能造成正则表达式崩溃:

# 它实际上相当于/hello \ \:\-\)\{2\}/,显然这是一个致命错误
print "matched\n" if /(\Q$pat){2}/; # 错误!漏掉了\E

3. 要点
 要留意正则表达式的优先级。
 可以使用圆括号将正则表达式分组。
 使用\Q或quotemeta将元字符转义为普通字符。
0 0
原创粉丝点击