简单介绍一下C#正则表达式

来源:互联网 发布:网络基本原理动画演示 编辑:程序博客网 时间:2024/06/05 13:22

 

对于初学者看到类似“\w+@\w+\.\w{1,3}”这样复杂没有规律的字符,就会莫名产生一种恐惧感。其实正则表达式和字符串(String)的使用同样非常简单。下面让我们逐步地走进正则表达式的世界!

什么是正则表达式

    正则表达式是用来检验和操作字符串的强大工具。简单的理解正则表达式可以认为是一种特殊的验证字符串。正则表达式常见运用是验证用户输入信息格式,比如上面的那组“\w{1,}@\w{1,}\.\w{1”,实际上就是验证邮件地址是否合法的;当然正则表达式不仅仅是用于验证,可以说只要运用字符串的地方都可以使用正则表达式;

涉及的基本的类

    正则表达式在英文中写作(Regular Expression),根据正则表达式的使用范围和单词意思,.NET将其命名空间设置为System.Text.RegularExpressions

    在该命名空间内包括了8个基本的类:CaptureCaptureCollectionGroupGroupCollectionMatchMatchCollectionRegexRegexCompilationInfo,具体的介绍如下:

Capture   用于单个表达式捕获结果

CaptureCollection   用于一个序列进行字符串捕获

Group       表示单个捕获的结果

GroupCollection       表示捕获组的集会

Match      表示匹配单个正则表达式结果

MatchCollection      表示通过迭代方式应用正则表达式到字符串中

Regex       表示不可变的正则表达式

RegexCompilationInfo     将编译正则表达式需要提供信息

    在正则表达式中拥有一套自己的语法规则,常见语法包括;字符匹配、重复匹配、字符定位、转义匹配和其他高级语法(字符分组、字符替换和字符决策);

    字符匹配语法:

字符语法         语法解释         语法例子

\d     匹配数字(0~9 \d’匹配8,不匹配12

\D     匹配非数字    \D’匹配c,不匹配3

\w    匹配任意单字符    \w\w’匹配A3,不匹配@3

\W    匹配非单字符        \W’匹配@,不匹配c

\s      匹配空白字符        \d\s\d’匹配3 d,不匹配abc

\S      匹配非空字符        \S\S\S’匹配A#4,不匹配3 d

.        匹配任意字符        ....’匹配A$ 5,不匹配换行;

[匹配括号中任意字符     [b-d]匹配bcd,不匹配e

[^]        匹配非括号字符     [^b-z]匹配a,不匹配b-z的字符;

    重复匹配语法:

重复语法         语法解释         语法例子

{n}    匹配n次字符          \d{3}匹配\d\d\d,不匹配\d\d\d\d\d\d

{n,}   匹配n次和n次以上     \w{2}匹配\w\w\w\w\w以上,不匹配\w

{n,m}         匹配n次上m次下         \s{1,3}匹配\s,\s\s,\s\s\s,不匹配\s\s\s\s

?       匹配01 5?匹配50,不匹配非50

+       匹配一次或多次     \S+匹配一个以上\S,不匹配非一个以上\S

*       匹配0次以上          \W*匹配0以上\W,不匹配非N*\W

    字符定位语法:

重复语法         语法解释         语法例子

^       定位后面模式开始位置        

$       前面模式位于字符串末端    

\A     前面模式开始位置        

\z      前面模式结束位置        

\Z     前面模式结束位置(换行前

\b     匹配一个单词边界        

\B     匹配一个非单词边界    

    转义匹配语法: 

转义语法         涉及字符(语法解释)      语法例子

\+实际字符     \ . * + ? | ( ) { }^ $   例如:\\匹配字符“\

\n     匹配换行        

\r      匹配回车        

\t      匹配水平制表符    

\v      匹配垂直制表符    

\f      匹配换页        

\nnn 匹配一个8进制ASCII  

\xnn 匹配一个16进制ASCII

\unnnn     匹配416进制的Uniode  

\c+大写字母  匹配Ctrl-大写字母        例如:\cS-匹配Ctrl+S

    构造正则表达式需要涉及Regex类,在Regex类中包括:IsMatch()Replace()Split()Match的类;

(1) IsMatch()方法;

    IsMatch()方法实际上是一个返回Bool值得方法,如果测试字符满足正则表达式返回True否则返回False

 

例;判断是非成都地区电话号码合法;

 

分析:成都地区电话号码组成028********,前面为固定区号028,后面满足8位数字;

 

设计正则表达式:028\d{8}(解释:028区号固定,后面为8个数字\d组成);

 

程序代码,

static void Main(string[] args)

        {

            string regxtest = "020\\d{8}";

            string s1="02021232133";

            string s2="12132332323";

            Console.WriteLine("是º?否¤?是º?广?YÌ?话¡ã:"+Regex.IsMatch(s1,regxtest).ToString());

            Console.WriteLine("是º?否¤?是º?广?YÌ?话¡ã:"+Regex.IsMatch(s2,regxtest).ToString());

            Console.ReadLine();

        }

 

(2) Replace()方法;

    Replace()方法实际上是一种替换的方法,替换匹配正则表达式匹配模式;

 

(3) Split()方法;

    Split()方法实际上是拆分的方法,根据匹配正则表达式进行拆分储存在字符串数组中;

 

例:从群发邮件地址中读取所有邮件地址;

 

分析:群发邮件采用“;”作为分割符,需要通过“;”进行拆分

 

程序代码:

static void Main(string[] args)

        {          

            string regxtest = ";";

            string str = "chenxilinbaby@126.com;hlinwork@126.com;tuolite123@qq.com";

            string[] grstr;

            grstr = Regex.Split(str, regxtest);

            foreach(string s in grstr)

            {

                Console.WriteLine(s.ToString());

            }

            Console.ReadLine();

        }

 正则表达式算不上一个复杂的东西,理解它的语法规则,多加以练习后就会慢慢习惯了!

原创粉丝点击