C#中的正则表达式对象[转载]

来源:互联网 发布:js drag and drop 编辑:程序博客网 时间:2024/05/17 06:20
C#中,.NET为我们提供了一个System.Text.RegularExpression命名空间,包含了一些我们常用的操作和运用RegularExpression的对象,属性和方法。其中相当重要的有Regex,Match,Group,Capture等对象。
         我们可以来看看这些对象之间有什么联系和区别,并学习在实际中运用它们。
 
说明
Capture
表示单个子表达式捕获中的结果。Capture表示单个成功捕获中的一个子字符串。
CaptureCollection
表示一个捕获子字符串序列。CaptureCollection返回由单个捕获组执行的捕获的集合。
Group
Group表示单个捕获组的结果。由于存在数量词,一个捕获组可以在单个匹配中捕获零个、一个或更多的字符串,因此 Group 提供 Capture 对象的集合。
GroupCollection
表示捕获组的集合。GroupCollection返回单个匹配中的捕获组的集合。
Match
表示单个正则表达式匹配的结果。
MatchCollection
表示通过以迭代方式将正则表达式模式应用于输入字符串所找到的成功匹配的集合。
Regex
表示不可变的正则表达式。
RegexCompilationInfo
提供编译器用于将正则表达式编译为独立程序集的信息。
 
首先我们接触到的就是Regex对象,表示不可变的正则表达式。另外Regex类包含若干静态方法,使您无需显式创建 Regex 对象即可使用正则表达式。使用静态方法等效于构造 Regex 对象,使用该对象一次然后将其销毁。
例如:
我们可以通过Regex的构造函数创建对象:
Regex objRegex = new Regex();
或者通过静态方法直接运用:
string strTarget= "123abc456def789g";
                   string strRegex = @"/d+";
    Console.WriteLine((System.Text.RegularExpressions.Regex.Matches(strTarget,strRegex)).Count);    
         以上就是直接通过静态方法的实例。
 
         运用RegularExpression就不可能不涉及到匹配。Match表示单个正则表达式匹配的结果。这一点不用解释,以
string strTarget= "123abc456def789g";
                   string strRegex = @"/d+";
    Console.WriteLine((System.Text.RegularExpressions.Regex.Matches(strTarget,strRegex)).Count);    
为例,一个Match可能就是123
 
         由于单个匹配可能涉及多个捕获组,因此 Match 具有返回 GroupCollection Groups 属性。GroupCollection具有返回每个组的访问器。Match Group 继承,因此可以直接访问匹配的整个子字符串。 Match 实例本身等效于 Match.Groups[0](在 Visual Basic 中为 Match.Groups(0))。Match对象是不可变的,并且没有公共构造函数。
         这里衍生出一个新的对象----GroupGroup表示单个捕获组的结果。在C#RegularExpression中用圆括号括起来表示一个捕获组。看例子:
string strTarget= "123abc456def789g";
string strRegex1 = @"/d+([a-z])+";
Console.WriteLine(Regex.Match(strTarget,strRegex,RegexOptions.IgnoreCase).Groups.Count);
这里用([a-z])来捕获单个英文字符。这就是一个捕获组。所以这里GroupsCount就是2个,Groups[0]等效于Match实例本身。Groups[1]’C’
由于存在数量词,一个捕获组可以在单个匹配中捕获零个、一个或更多的字符串,因此 Group 提供 Capture 对象的集合。
Capture,顾名思义,就是一次捕获,还是以上面的正则表达式例子:
Console.WriteLine(Regex.Match(strTarget,strRegex1,RegexOptions.IgnoreCase).Groups[1].Captures.Count);
通过输出我们可以看见有3Capture,如果我们都打印出来会发现分别是a,b,cGroups[1]保留了最后一次捕获。
至此,我们可以大概了解了。这些常用对象。
至于如何运用,还是要视具体情况,正则表达式主要用以处理文本,如果机会合适还是可以节约很多工作量的,推荐大家使用。
也欢迎大家就这方面继续深入和我讨论。
 

Trackback: http://tb.blog.csdn.net/TrackBack.aspx?PostId=845761

 
原创粉丝点击