正则表达式 regular expression(二)

来源:互联网 发布:qq飞车s车时空战舰数据 编辑:程序博客网 时间:2024/05/22 15:33

注:本文内容为摘自Mastering regular expressions(《精通正则表达式》)的笔记。

1.Egrep元字符:


*量词(quantifiers):限定所作用元素的作用次数。   e.g.7月4号的表示:(July|Jul) (fourth|4th|4)➡️July? (fourth|4th|4)➡️July?(fourth|4(th)?)

*规定重复的范围:区间,也叫区间量词(interval quantifier)....{min,max} ,注,有的Egrep版本可能不支持区间。   e.g.[a-zA-Z]{1,5}

*括号(parentheses):限制多选项的范围;将若干字符组合为一个单元,受问号或星号之类的量词作用;反向引用(back-reference)e.g.(\<[A-Z][a-z]+) +\1\>;([a-z])([0-9])\1\2


*转义(escape):反斜线加元字符表示为普通字符,不过在字符组内部无效。

2.正则表达式也有很多流派(flavor)。

3.经典实例:

*匹配标识符:仅包含字母数字及下划线且不能以数字开头:[a-zA-Z_][a-zA-Z_0-9]*

*引号内的字符串:"[^"]*"

*Web URL


正则表达式在复杂性与完整性之间的平衡,一个重要因素是了解待搜索的文本。

1 0
原创粉丝点击