正则表达式

来源:互联网 发布:淘宝小号出租 编辑:程序博客网 时间:2024/05/23 01:17

-- Start

如果你还不知道什么是正则表达式或者不是很清楚,请先阅读 正则表达式精萃

下面是一个在 Perl 中使用正则表达式的简单例子。

#!/usr/bin/perl# qr/.../ 用来定义正则表达式# 在定义的同时,可以不指定或指定一个或多个全局匹配模式# 下面的代码构建了用来匹配固定电话号码的正则表达式, 采用不区分大小写和多行模式my $regex = qr/(\d{3}\d?)-(\d{7}\d?)/is;# 定义测试文本my $text = "我的电话号码是 0411-88888888, 欢迎骚扰。";# 采用match运算符在指定的目标字符串中查找符合正则表达式的子串if($text =~ m/$regex/) {print "在目标字符串的$-[0]到$+[0]位置找到了$&\n"; print "在目标字符串的$-[1]到$+[1]位置找到了电话号码的区号$1\n";print "在目标字符串的$-[2]到$+[2]位置找到了电话号码$2\n";} else {print "没有找到匹配的电话号码。\n";}
  • qr/…/运算符用来定义正则表达式
  • m/.../运算符在指定的目标字符串中查找符合正则表达式的子串
  • $` 变量存储匹配之前的文本
  • $& 变量存储匹配的文本
  • $' 变量存储匹配之后的文本
  • $1 变量存储第一个捕获括号中匹配的内容
  • $n 变量存储第n个捕获括号中匹配的内容
  • $+ 变量存储编号最大的括号中匹配的文本
  • $^N 变量存储最后结束的括号中匹配的文本
  • @- 数据中存储整个匹配和捕获括号开始位置的偏移量
  • @+ 数据中存储整个匹配和捕获括号结束位置的偏移量

在构建正则表达式对象时,我们可以指定零个或多个全局匹配模式,Perl 支持如下匹配模式。

全局匹配模式描述/s点号能够匹配换行符/m^和$可以匹配字符串内部换行符/x注释模式/i忽略大小写模式/o仅编译一次/g全局匹配

 

事实上,如果正则表达式只使用一次,我们根本就无需通过qr来定义正则表达式。此外,来列表上下文中使用match(m/.../) 操作符时,我们可以直接得到捕获型括号中的内容。

#!/usr/bin/perl# 定义测试文本my $text = "我的电话号码是 0411-88888888, 欢迎骚扰。";# 在列表上下文中使用 match 运算符my ($prefix, $suffix) = ($text =~ m/(\d{3}\d?)-(\d{7}\d?)/is);if(defined $prefix) {print "在目标字符串的$-[1]到$+[1]位置找到了电话号码的区号$prefix\n";print "在目标字符串的$-[2]到$+[2]位置找到了电话号码$suffix\n";} else {print "没有找到匹配的电话号码。\n";}


 上面我们介绍了如何进行查找操作, 下面我们通过一个例子看一下如何进行替换操作。

#!/usr/bin/perl# 定义测试文本my $text = "我的电话号码是 0411-88888888, 欢迎骚扰。";# 在列表上下文中使用 match 运算符$text =~ s/(\d{3}\d?)-(\d{7}\d?)/18999999999/g;print $text;
  • substitution运算符(s/regex/replacement/modifier)用来执行替换操作.
  • regex 部分是任意的正则表达式.
  • replacement部分相当于双引号字符串,支持变量插值.
  • modifier 部分是匹配模式,除了支持上面的匹配模式外,还支持 /e
  • 如果 modifier 是/e,则replacement部分perl代码

下面我们看一个使用 /e 匹配模式的例子。

#!/usr/bin/perl# 定义测试文本my $text = "我的工资是 1000";# 在列表上下文中使用 match 运算符$text =~ s!(\d+)!$1/6.3698!e; # 转换汇率print $text;
  • substitution运算符的分隔符随意指定,上面的例子是叹号。
  • $1 为反向引用第一个括号中匹配的内容。
  • 使用 /e 匹配模式对 $1/6.3698 进行求值。

-- 更多参见:Perl 精萃

-- 声 明:转载请注明出处
-- Last Updated on 2012-07-02
-- Written by ShangBo on 2012-06-30
-- End