正则表达式

来源:互联网 发布:网络的利与弊ppt 编辑:程序博客网 时间:2024/06/03 06:05

正则表达式是一串特定字符,组成一个“规则字符串”,这个“规则字符串”是描述文本规则的工具,正则表达式就是记录文本规则的代码。
规则定义:

[]              :默认表示一个字符[abc]           :表示a、b、c中任意一个字符[^abc]          :除了a、b、c的任意一个字符[a-z]           :表示a到z中的任意一个字符[a-zA-Z0-9_]    :表示a到z、A到Z、0到9以及下滑线中的任意一个字符**[a-z&&[^bc]]  :表示a到z中除了b、c之外的任意一个字符,&&表示“与”的关系.              :表示任意一个字符|               :或\               :转义 ,              :分割\d              :任意一个数字字符,**等价于[0-9]**\D              :任意一个非数字字符,**等价于[^0-9]**\s              :空白字符,**等价于[\t\n\f\r\x0B]**\S              :非空白字符,**等价于[^\s]**\w              :任意一个单词字符,**等价于[a-zA-Z0-9_]**\W              :任意一个非单词字符,**等价于[^\w]**^               :表示字符串必须以他后面约束的内容开始**(作为开始)**$               :表示字符串必须以他前面约束的内容结尾**(作为结束)**?               :表示前面的内容出现**0到1次(重复0次或1次)***               :表示前面的内容出现**0到多次(重复任意次)**+               :表示前面的内容出现**1到多次(重复>=1次)**{n}             :表示前面的字符**重复n次**{n,}            :表示前面的字符**至少重复n次(重复>=n次)**{n,m}           :表示前面的字符 **至少重复n次,并且小于m次( 重复>=n次 && 重复小于m次)**

等价关系:
?,*,+,\d,\w 都是等价字符
?等价于匹配长度{0,1}
*等价于匹配长度{0,}
+等价于匹配长度{1,}
\d等价于[0-9]
\w等价于[A-Za-z_0-9]。

常用的正则表达式:

1. 验证用户名和密码:("^[a-zA-Z]\w{5,15}$")正确格式:"[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位;2. 验证电话号码:("^(\\d{3,4}-)\\d{7,8}$")正确格式:xxx/xxxx-xxxxxxx/xxxxxxxx;3. 验证手机号码:"^1[3|4|5|7|8][0-9]\\d{8}$";4. 验证身份证号(15位或18位数字):"\\d{14}[[0-9],0-9xX]";5. 验证Email地址:("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$");6. 只能输入由数字和26个英文字母组成的字符串:("^[A-Za-z0-9]+$") ;7. 整数或者小数:^[0-9]+([.][0-9]+){0,1}$8. 只能输入数字:"^[0-9]*$"。9. 只能输入n位的数字:"^\d{n}$"。10. 只能输入至少n位的数字:"^\d{n,}$"。11. 只能输入m~n位的数字:"^\d{m,n}$"。12. 只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。13. 只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。14. 只能输入有1~3位小数的正实数:"^[0-9]+(\.[0-9]{1,3})?$"。15. 只能输入非零的正整数:"^\+?[1-9][0-9]*$"。16. 只能输入非零的负整数:"^\-[1-9][0-9]*$"。17. 只能输入长度为3的字符:"^.{3}$"。18. 只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。19. 只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。20. 只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。21. 验证是否含有^%&',;=?$\"等字符:"[%&',;=?$\\^]+"。22. 只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"。23. 验证URL:"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"。24. 验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"10"~"12"。25. 验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式    为;"01"~"09"、"10"~"29"和“30”~“31”。26. 获取日期正则表达式:\\d{4}[年|\-|\.]\d{\1-\12}[月|\-|\.]\d{\1-\31}日?    评注:可用来匹配大多数年月日信息。27. 匹配双字节字符(包括汉字在内):[^\x00-\xff]    评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)28. 匹配空白行的正则表达式:\n\s*\r    评注:可以用来删除空白行29. 匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />    评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力30. 匹配首尾空白字符的正则表达式:^\s*|\s*$    评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式31. 匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*    评注:网上流传的版本功能很有限,上面这个基本可以满足需求32. 匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$    评注:表单验证时很实用33. 匹配腾讯QQ号:[1-9][0-9]{4,}    评注:腾讯QQ号从10 000 开始34. 匹配中国邮政编码:[1-9]\\d{5}(?!\d)    评注:中国邮政编码为6位数字35. 匹配ip地址:([1-9]{1,3}\.){3}[1-9]。    评注:提取ip地址时有用36. 匹配MAC地址:([A-Fa-f0-9]{2}\:){5}[A-Fa-f0-9]    Function IsRegu(Regu,s)

java测试对应字符串的正则表达式的类和方法
Pattern的作用是描述正则表达式的格式支持,使用静态方法compile注册正则表达式,生成实例。

String regStr="^[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.com|\\.cn|\\.net)+$";//定义邮箱正则表达式Pattern pattern=Pattern.compile(regStr);//注册正则表达式String mailStr="chang_2013@chang.com.cn";//自己的邮箱格式//匹配字符串,返回描述匹配结果的Matcher实例Matcher matcher=pattern.matcher(mailStr);//通过调用Matcher的find方法得知是否匹配成功if(matcher.find()){     System.out.println("邮箱匹配成功!");      }else{      System.out.println("邮箱格式错误!");          }

注:在这里用到的两个类是Pattern (java.util.regex.Pattern)和Matcher (java.util.regex.Matcher)

javascript测试对应字符串的正则表达式的类和方法
1)方法:
①replace(regexp,”replacestr”):返回替换后的结果。
②match(regexp):返回匹配字符串的数组。
③search(regexp):得到匹配字符串的“首“字符位置的索引。
2)JavaScript中使用正则表达式:使用两个斜杠, / 表达式 / 匹配模式
①正则表达式回顾:\d 或者 [a-z]{3,5}。就是纯文本的表达式,用来表示某种匹配模式。在不同的语言环境下,提供了不同的类,执行或者使用正则表达式,实现文本的各种处理。
②匹配模式:g:global,全局匹配;m:multilin,多行匹配;i:忽略大小写匹配。

例如:var str1="abc123def";var str2=str1.replace(/\d/g,"*");alert(str2);//abc***def,如果不用全局匹配则只替换一个数字var array=str1.match(/\d/g);//1,2,3var index=str1.search(/\d/);alert(index);//3

3)案例

eg1:查找并替换文本框中录入的子字符串 js 为 *<input type="text" id="txtString" /><input type="button" value="过滤特殊字符(js)" onclick="searchStringAndReplace();" />function searchStringAndReplace() {     var str = document.getElementById("txtString").value;    var count = 0;          var index = str.indexOf("js", 0);    while (index > -1) {             str = str.replace("js","*");          index = str.indexOf("js", index + 1);        }    document.getElementById("txtString").value = str;                      }eg2:字符查询与过滤(使用正则表达式)<input type="text" id="txtString" /><br /><input type="button" value="查找字符并过滤" onclick="stringByRegex();" />function stringByRegex() {      var str = document.getElementById("txtString").value;    var result = str.match(/js/gi);    document.getElementById("txtString").value = str.replace(/js/gi, "*");    alert("共替换了" + result.length + "处。");                               }

注意事项:
(1)邮箱格式的正则表达式 @无特殊含义,可直接写,也可[@]
(2)使用Java字符串去描述正则表达式的时候,会出现一个冲突,即如何正确描述正则表达式的“.”。
起因:在正则表达式中我们想描述一个“.”,但“.”在正则表达式中有特殊含义,他代表任意字符,所以我们在正则表达式中想描述“.”的愿义就要写成“\.”但是我们用java字符串去描述正则表达式的时候,因为“.”在java字符串中没有特殊意义,所以java认为我们书写String s=”\.”;是有语法错误的,因为“.”不需要转义,这就产生了冲突。
处理:我们实际的目的很简单,就是要让java的字符串描述”\.”又因为在java中”\”是有特殊含义的,代表转义字符我们只需要将”\”转义为单纯的斜杠,即可描述”\.”了所以我们用java描述“\.”的正确写法是String s=”\.”;
(3)若正则表达式不书写^或$,正则表达式代表匹配部分内容,都加上则表示权匹配

0 0