正则表达式

来源:互联网 发布:诺基亚e72i 软件下载 编辑:程序博客网 时间:2024/06/01 14:48

正则表达式由原子,有特殊功能的字符以及修正符组成,描述了一种字符串匹配的模式,通过这个模式在特定函数中对字符串进行匹配,查找,替换以及分割等操作。正则检测工具:http://regexpal.isbadguy.com

1.定界符


使用与Perl兼容的正则表达式,通常将模式表达式放入定界符中。例如“#”“/””{}”“|”等。

2.原子


(1)原子分为可见原子和不可见原子。可见原子有很多,比如数字789,字母adF,$#.}等等。不可见原子通常有空格,回车\n,制表符\t等。
(2) 通用字符类型:用于表示一类字符。如\d(十进制数字,0-9),\D(除十进制数字以外的字符),\s(匹配任意一个不可见字符),\S(可见字符),\w(任意的数字,字母,下划线),\W(匹配除数字字母下划线外的字符)

3.元字符


具有特殊意义的字符。


(1)量词(限定符):{n}(原子恰好出现n次),{n,}(原子至少出现n次),{n,m}(原子至少出现n次,至多出现m次),*(原子出现0次,1次或很多次),?(原子出现0次或1次),+(原子出现1次或多次)
(2)边界限制符:^或\A(字符串的开始),$或\Z(字符串的结束),\b(描述字符串的前或后边界),\B(表示非单词边界)
(3)句号”.”:可以匹配除换行符以外的任何字符
(4)模式单元:模式单元是使用元字符”()”将多个原子组成大的原子,被当做一个单元独立使用。优先匹配。

4.模式修正符


模式修正符在表达式定界符之外使用, 用来调整正则表达式的解释。常用修正符有:i(不区分大小写),m(规定多行字符串的每行的开始和结尾),s(将字符串视为单行,换行符作为普通字符串),x(除了被转义的空白字符,模式中的空白忽略不计),U(启用懒惰模式)

0 0
原创粉丝点击