JavaScript正则表达式

来源:互联网 发布:为什么淘宝一支独秀 编辑:程序博客网 时间:2024/05/23 07:25

什么是正则表达式?

正则表达式也叫做匹配模式(Pattern),它由一组具有特定含义的字符串组成,通常用于匹配和替换文本。
在JavaScript脚本中,利用正则表达式可以很容易的实现文本字符串的检测、替换等功能。
正则表达式是字符串,它定义了一个用来搜索匹配字符串的模式。定义模式:/表达式/


JavaScript脚本语言中引入正则表达式主要作用:
验证字符串格式
查找字符串
替换文本


创建方式:
1、采用RegExp对象的显式构造函数构造
var regObj = new RegExp(“pattern”,[,”flags”]);
pattern:必选项,正则表达式的字符串(模式字符串);
flags:可选项,一些标志组合。
2、采用RegExp对象的隐式构造函数构造
var regObj = /pattern/[flags];该方式不能用引号将pattern和flags括起来


flags标志信息项
i 忽略大小写标志
g 表示在全文中查找出现的所有参数
m 多行标志


显示创建正则表达式:
var myregx=new RegExp(“abc”);
可以加标志信息,如忽略大小写:
var myregx=new RegExp(“abc”,”i”);


隐式创建正则表达式:
var myregx=/tanggao/;
可以加标志信息,如全文搜索且忽略大小写:
var myregx=/tanggao/ig;
两种构造方式效果是一样的,但仍有小差别,隐式构造在脚本执行时进行编译,一般常用到这个正则表达式式时,用隐式构造法;显式构造法遇到正则表达式时才进行编译,在这个表达式使用较少下使用显式构造法。



正则表示对象RegExp对象的方法:


exec:检索字符中是正则表示的匹配,返回找到的值,并确定其位置。
eg:
语法:reg.exec(str);

<script>var reg=/tanggao/;var str='istanggao'var result=reg.exec(str)//成功返回tanggao 失败返回nullalert(result)</script>

将会输出tanggao,因为正则表达式reg会匹配str(‘istanggao’)中的’tanggao’子字符串,并且将其返回。
使用函数匹配方式

<script> function  execReg(reg,str){  var result =  reg.exec(str);  alert(result); } var reg = /tanggao/; var str = 'istanggao'; execReg(reg,str);</script>

test:检索字符串中指定的值,返回true或false。
eg:

 <script>            var reg=/tanggao/;                      var str='isTanggao istanggao'            var result=reg.test(str)//成功返回true 失败返回false            alert(result) </script>  //结果 false  因为区分大小写

<script>            var reg=/tanggao/i;         //i表示忽略大小写            var str='isTanggao istanggao'            var result=reg.test(str)//成功返回true 失败返回false            alert(result)   //结果true            var reg=/tanggao/ig;            //i表示忽略大小写  g表示开启全局            var str='isTanggao istanggao'            var result=reg.test(str)//成功返回true 失败返回false            alert(result)</script> 

compile( )方法:更换RegExp对象实例所使用的表达式模式
compile()既可以改变检索模式,也可以添加或删除第二个参数

    <script>            var reg=/tanggao/;      var str='isTanggao ';      var result1=reg.test(str);      alert(result1);//结果返回false  区分大小写      reg.compile("i");   //添加i 区分大小写的标志信息项      var result2=reg.test(str)       alert(result2); //结果为true    reg.compile("tg");//模式字符串改为tg   >>reg=/tanggao/        var result=reg.test(str);//成功返回true 失败返回false        alert(result)   //结果为false 因为模式字符串reg已经用compile改为tg了    reg.compile("Tanggao","i");        var result=reg.test(str);//成功返回true 失败返回false        alert(result)   //结果为true 因为模式字符串reg已经用compile改为Tanggao了 并且添加了 i 区分大小写的标志信息项    </script>

string对象的方法:
match:找到一个或多个正则表示的匹配,该方法类似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字符串的位置


var str="Hello world! world!"   //  match()   找到返回匹配字符串   找不到返回null            document.write(str.match("world") + "<br />")//输出结果为world 因为match找到了 模式串中的world            document.write(str.match("World") + "<br />")//输出结果为 null 因为区分大小写            document.write(str.match("worlld") + "<br />")//输出结果为null            document.write(str.match("world!") + "<br />"); //输出结果为world! 没有开启全局  只返回前一个匹配是的字符串            document.write(str.match("world!","g")); //输出结果为world! world!   因为  开启了全局  

search:


检索与正则表达式相匹配的位置的值;如果没有找到任何匹配的子串,则返回 -1。search() 方法不执行全局匹配,它将忽略标志 g。它同时忽略 regexp 的 lastIndex 属性,并且总是从字符串的开始进行检索,这意味着它总是返回 stringObject 的第一个匹配的位置;对大小写敏感

 <script>            var reg=/tanggao/gi;            //i表示忽略大小写  g表示开启全局 但是该方法屏蔽全局 就是忽略全局            var str='is Tanggao Tanggao'            var result=str.search(reg)//成功返回开始匹配的位置 从0开始 空格算一个位置  失败返回-1            document.write(result)     </script>

replace:替换与正则表达式匹配的字符串;第二个参数替换第一个参数

<script>            var reg=/tanggao/;                      var str='is Tanggao tanggao'             var result=reg.test(str )// true            document.write(result+"<br />")            var s=str.replace(/tanggao/ig,"tg");  //i表示忽略大小写  g表示开启全局  用tg 替换tanggao  开了全局和不区分大小写              document.write(s+"<br />")               var result1=reg.test(s)  //结果为   is tg tg              document.write(result1)  //结果为false     </script>

split:把字符串分隔为字符串数字;//结果为一个数组;


参数 描述
separator 必需。字符串或正则表达式,从该参数指定的地方分割 stringObject。
howmany 可选。该参数可指定返回的数组的最大长度。如果设置了该参数,返回的子串不会多于这个参数指定的数组。如果没有设置该参数,整个字符串都会被分割,不考虑它的长度。

<script type="text/javascript">        var str="How are you doing today?"        document.write(str.split(" ") + "<br />") // 结果  How,are,you,doing,today?        document.write(str.split("") + "<br />")  // 结果 H,o,w, ,a,r,e, ,y,o,u, ,d,o,i,n,g, ,t,o,d,a,y,?        document.write(str.split(" ",3))      //  以空格分割  数组长度为3   结果 How,are,you</script>

注意:因为这四个方法是属于string 所以
语法:第二个参数.方法(第一个参数)
比如 上面中str.match(reg)


RegExp对象的属性:
静态属性
这里写图片描述


实例属性:
global:RegExp对象是否具有标志g;//全局查询,如果没有这个属性则在第一次匹配之后就结束操作;


ignorCase:RegExp对象是否具有标志i;//忽略大小写;


multiline:RegExp对象是否具有标志m;//多行查询;
它声明了给定的正则表达式是否以多行模式执行模式匹配。
在这种模式中,如果要检索的字符串中含有换行符,^ 和 /W3School/im 匹配 “w3school” 和 “W3School\nisgreat”。(\n 是换行符\u000A)。
如果 m 标志被设置,则该属性为 true,否则为 false。

  <script>        var reg=/^\d+/gm    //限定了首匹配 并且开启了多行模式        var str='1.baidu\n2.google\n3.bing'        var result=str.replace(reg,'#')        alert(result)     </script>

lastIndex – 整数,使用exec或test方法时被填入,表示下次匹配将会从哪个字符位置开始;
语法
stringObject.lastIndexOf(searchvalue,fromindex)
参数 描述
searchvalue 必需。规定需检索的字符串值。
fromindex 可选的整数参数。规定在字符串中开始检索的位置。它的合法取值是 0 到 stringObject.length - 1。如省略该参数,则将从字符串的最后一个字符处开始检索。
如果要检索的字符串值没有出现,则该方法返回 -1。

<script type="text/javascript">        var str="Hello world!"        document.write(str.lastIndexOf("Hello") + "<br />") // 0        document.write(str.lastIndexOf("World") + "<br />")//-1        document.write(str.lastIndexOf("world"))//6    </script>

source – 正则表达式的元字符串形式。source 属性来获得用于模式匹配的文本
如 /\/的source将返回”\“。

<script type="text/javascript">var str = "Visit W3School.com.cn";var patt1 = new RegExp("W3S","g");document.write("The regular expression is: " + patt1.source);//The regular expression is: W3S </script>

正则表达式的常用符号:
字符匹配符


/.../:代表一个模式的开始和结束;
    <script>            var reg  = /.../;             var str = '维生素c';            var result=reg.exec(str)              alert(result)//结果维生素            var str = 'cainiao';             var result=reg.exec(str)              alert(result)//结果cai         </script>
s:任何空白字符;S:任何非空白字符;d:匹配一个数字字符,等级[^0-9];D:除了数字之外的任何字符,等价于[^0-9];w:匹配一个数字,下划线或者字母字符,等价于[A-Za-z0-9];W:任何非单字字符,等价于[^a-zA-Z0-9];.:除了换行符之外的任何字符;
<script>            var reg  = /./;             var str = '维生素c';            var result=reg.exec(str)              alert(result)//结果维            var str = 'cainiao';             var result=reg.exec(str)              alert(result)//结果c    </script>

定位符
^ 与字符串的开始的地方匹配

<script>            var reg  = /^c/;             var str = '维生素c';            var result=reg.exec(str)              alert(result)//结果为null,字符串不是以“c”打头的             var str = 'cainiao';             var result=reg.exec(str)              alert(result)//返回c,匹配成功,字符串是以“c”打头的      </script>

$ 与字符串结束的地方匹配

<script>            var reg  = /c$/;             var str = '维生素c';            var result=reg.exec(str)              alert(result)//结果c,字符串是以“c”结束的             var str = 'cainiao';             var result=reg.exec(str)              alert(result)//返回null,字符串不是以“c”结束的        </script>

\b 匹配一个单词边界,就是单词和空格之间的位置 ,只有字符串的开头和结尾才算数(单个字符右边界前面必须有空格 左边界可以没有)

<script>            var reg  = /\bc/; //以c开头            var str = 'bcd c';            var result=reg.exec(str)              alert(result)//c  中间有空格 空格后以C结尾                var reg  = /\bb/; //以b开头            var str = 'bbc';             var result=reg.exec(str)              alert(result)//结果b  zuo边界为b             var str = 'sdbsds';             var result=reg.exec(str)              alert(result)//结果null    </script>
<script>        var reg=/google\b/ //以e结尾        var str='google';           var result=reg.exec(str)              alert(result)        var reg=/\bgoogle/        var result=reg.exec(str)              alert(result)  //以g开头        </script>

\B 就是\b取非,即匹配一个非单词边界

<script>            var reg  = /\Bc/;             var str = 'b c';            var result=reg.exec(str)              alert(result)//null   因为已c 为边界  而\B是\b取非                            var reg  = /\Bb/;             var str = 'bc';             var result=reg.exec(str)              alert(result)//结果null               var reg  = /\Bd/;               var str = 'sdbsds';             var result=reg.exec(str)              alert(result)//结果d 因为不是以d 为边界        </script>

限定符
{n}/匹配前一项n次

<script>        var reg=/t{2}/   //表示连续匹配2个t        var str='ttang'        var result=reg.exec(str);        alert(result); //结果为tt        var str='tantg'        var result=reg.exec(str);        alert(result);   结果为null  </script>

{n,}:匹配前一项n次,或者多次;

   <script>        var reg=/t{2,}/   //表示连续匹配2个t 或者2个以上        var str='ttang'        var result=reg.exec(str);        alert(result); //结果为tt        var str='tttantg'        var result=reg.exec(str);        alert(result);   结果为ttt    </script>

{n,m}:匹配前一项至少n次,但是不能超过m次;(区间n-m次)

<script>        var reg = /google{3,4}$/g;    var str = 'googleee';     var result=reg.test(str);        alert(result); //返回结果true   var str = 'ccTest';     var result=reg.test(str);        alert(result); //返回结果false     var str = 'googleeeee';     var result=reg.test(str);        alert(result); //返回结果false</script>
*:匹配前一项0次或者多次,等价于{0,};+:匹配前一项1次或者多次,等价于{1,};?:匹配前一项0次或者1次,等价于{0,1};

选择匹配符
|:表示或者的意思;eg:[0-9]|[a-z];

<script>            var reg  = /b|c/;             var str = '维生素b';            var result=reg.exec(str)              alert(result)//结果c            var str = 'cainiao';             var result=reg.exec(str)              alert(result)//结果c              var str= 'bbs.blueidea.com';               var result=reg.exec(str)              alert(result)//结果只有一个b 第一个成立就不会输出c.com  第一个不成立才输出c                var str= 's.lueidea.com';               var result=reg.exec(str)              alert(result)//结果c   第一个不成立才输出c     </script>

/[abc]/可以匹配a、b、c中任意一个字符

     <script>            var reg  = /[abc]/;             var str = '维生素b';            var result=reg.exec(str)              alert(result)//结果b            var str = 'cainiao';             var result=reg.exec(str)              alert(result)//结果c     </script>

反向类:[^]用来匹配不在括号内的任意字符。
如:/[^abc]/可匹配除a、b、c外的其他任意字符

<script>            var reg  = /[^abc]/;             var str = 'bc';            var result=reg.exec(str)              alert(result)//结果null            var str = 'ca';             var result=reg.exec(str)              alert(result)//结果null             var str = 'sdsds';             var result=reg.exec(str)              alert(result)//结果s   </script>

范围类:[0-9]表示匹配从0-9任意的数字

( ):用于分组;

<script>        var reg=/^([a-z]+)\s([0-9]{4})$/  //使用了分组 这个是捕获性分组 所有的分组都要返回 结果返回一个数组        var str='tanggao 1994'        var result=reg.exec(str)        alert(result) //返回整个数组  tanggao 1994,tanggao,1994        alert(result[0])// 返回匹配到的整个字符串 tanggao 1994        alert(result[1])//返回匹配到的第一个分组的字符串   tanggao         alert(result[2])//返回匹配到的第二个分组的字符串  1994 </script>
<script>        var reg=/^(?:[a-z]+)\s([0-9]{4})$/  //使用了分组 这个是非捕获性分组 只要在不需要返回的分组加上?:        var str='tanggao 1994'        var result=reg.exec(str)        alert(result) //不返回第一个分组tanggao   结果为 tanggao 1994,1994   少了 tnaggao</script>
<script>        var reg=/(a?(b?(c?)))/    //使用嵌套分组   从外往内获取  ?表示一个或0个        var str='abc'        var result=reg.exec(str)        alert(result[0]) //整个匹配到的字符串abc        alert(result[1]) //匹配到的第一个分组(a?(b?(c?))) abc        alert(result[2]) //匹配到的第二个分组(b?(c?))  bc        alert(result[3]) //匹配到的第三个分组(c?)  c</script>

<script>    var reg=/tang(?=gao)/    //使用前瞻性捕获 ?=    var str='tanggao'    var result=reg.exec(str)    alert(result) //返回tang  这是前瞻性捕获  </script>

 <script>        var pattern=/8(.*)8/;  //        var str='this is a 8baidu8';           document.write(str.replace(pattern,'<strong>$1</strong>'));        //$1表示分组获取字符串匹配到的内容            var reg=/(.*)\s(.*)/            var str='baidu google'            alert(str.replace(reg,'$2,$1'))  //交换baidu google顺序 得到 google baidu        </script>

这里写图片描述


关于贪婪和惰性模式.

所谓的贪婪模式就是这样.在整个表达式匹配成功的前提下,尽可能多的匹配
所谓的惰性模式就是,在整个表达式匹配成功的前提下,尽可能少的匹配.
实例:

var pattern=/[a-z]+/; //使用了贪婪模式var str='abcdef';alert(str.replace(pattern,'1'));   //所有的字符串变成了1//运行结果就是1var pattern=/[a-z]+?/;   //使用惰性模式var str='abcdef';alert(str.replace(pattern,'1'));   //只有第一个字符变成了1,后面没有匹配//运行结果就是1bcdefvar pattern=/8(.*)8/;  //使用了贪婪模式var str='8google8  8google8 8google8';   document.write(str.replace(pattern,'<strong>$1</strong>'));//结果是google8 8googlr8 8googlevar pattern=/8(.*?)8/;  //使用了惰性var str='8google8  8google8 8google8';   //匹配到了goole  8googlr8 8googledocument.write(str.replace(pattern,'<strong>$1</strong>'));//结果是google 8google8 8google8

不管是贪婪还是惰性模式,在遇到全局开启的情况下会怎样呢??
全局匹配模式:使用了’g’标识符.在全局匹配下,会对指定查找的字符串进行多次匹配.

var pattern=/[a-z]+/g; //使用了贪婪模式var str='abcdef';alert(str.replace(pattern,'1'));   //所有的字符串变成了1//运行结果就是111111var pattern=/[a-z]+?/g;   //使用惰性模式,开启全局var str='abcdef';alert(str.replace(pattern,'1'));   //所有的字符串变成了1 因为开启了全局 都匹配//运行结果就是111111var pattern=/8(.*)8/g;  //使用了贪婪模式,全局开启var str='8google8  8google8 8google8';   //匹配到了goole8  8googlr8 8googledocument.write(str.replace(pattern,'<strong>$1</strong>'));//结果是google8 8googlr8 8googlevar pattern=/8(.*?)8/g;  //使用了惰性,开启全局var str='8google8  8google8 8google8';   //匹配到了goole  google googledocument.write(str.replace(pattern,'<strong>$1</strong>'));//结果是google google google<script>        var pattern=/8(.*?)8/;  //使用了惰性,关闭全局         var str='8google8  8google8 8google8';   //匹配到了goole        document.write(str.replace(pattern,'<strong>$1</strong>')); //结果是google 8google8 8google8</script>

贪婪模式,在开启全局和不开启全局下的结果是一样的.因为贪婪模式就是贪婪到底,和全局匹配要多次匹配是一样的道理.
而惰性模式,在开启全局的时候,就会进行多次匹配.得到的结果也是不一样的.


实际应用 验证
全是字母:
var reg = /^[a-zA-Z]+$/;至少有一个字母;


四个字母:
var reg = /^[a-zA-Z]{4}$/;加上’^’避免了”3dedf”这类的也匹配上去;


11位qq号,第一位不能为0:
/^[1-9]{1}d{10}$/


18位身份证号:
/^d{17}(d{1}|[a-zA-Z}{1})$/


邮箱:
/^w{2,}@w{2,}(.[a-zA-Z]{2,4}){1,2}$/;这样就可以匹配xx@yy.com.cn;


//判断输入内容是否为空

function IsNull(){        var str = document.getElementById('str').value.trim();        if(str.length==0){            alert('对不起,文本框不能为空或者为空格!');//请将“文本框”改成你需要验证的属性名称!        }    }    

//判断日期类型是否为YYYY-MM-DD格式的类型

function IsDate(){         var str = document.getElementById('str').value.trim();        if(str.length!=0){            var reg = /^(\d{1,4})(-|\/)(\d{1,2})\2(\d{1,2})$/;             var r = str.match(reg);             if(r==null)                alert('对不起,您输入的日期格式不正确!'); //请将“日期”改成你需要验证的属性名称!            }    }     

//判断日期类型是否为YYYY-MM-DD hh:mm:ss格式的类型

function IsDateTime(){         var str = document.getElementById('str').value.trim();        if(str.length!=0){            var reg = /^(\d{1,4})(-|\/)(\d{1,2})\2(\d{1,2}) (\d{1,2}):(\d{1,2}):(\d{1,2})$/;             var r = str.match(reg);             if(r==null)            alert('对不起,您输入的日期格式不正确!'); //请将“日期”改成你需要验证的属性名称!        }    }     

//判断日期类型是否为hh:mm:ss格式的类型

function IsTime()     {         var str = document.getElementById('str').value.trim();        if(str.length!=0){        reg=/^((20|21|22|23|[0-1]\d)\:[0-5][0-9])(\:[0-5][0-9])?$/             if(!reg.test(str)){                alert("对不起,您输入的日期格式不正确!");//请将“日期”改成你需要验证的属性名称!            }        }    }     

//判断输入的字符是否为英文字母

function IsLetter()     {             var str = document.getElementById('str').value.trim();            if(str.length!=0){            reg=/^[a-zA-Z]+$/;             if(!reg.test(str)){                alert("对不起,您输入的英文字母类型格式不正确!");//请将“英文字母类型”改成你需要验证的属性名称!            }            }    }     

//判断输入的字符是否为整数

function IsInteger()     {               var str = document.getElementById('str').value.trim();            if(str.length!=0){            reg=/^[-+]?\d*$/;             if(!reg.test(str)){                alert("对不起,您输入的整数类型格式不正确!");//请将“整数类型”要换成你要验证的那个属性名称!            }            }    }     

//判断输入的字符是否为双精度

function IsDouble(val)     {             var str = document.getElementById('str').value.trim();            if(str.length!=0){            reg=/^[-\+]?\d+(\.\d+)?$/;            if(!reg.test(str)){                alert("对不起,您输入的双精度类型格式不正确!");//请将“双精度类型”要换成你要验证的那个属性名称!            }            }    }     

//判断输入的字符是否为:a-z,A-Z,0-9

function IsString()     {             var str = document.getElementById('str').value.trim();            if(str.length!=0){            reg=/^[a-zA-Z0-9_]+$/;             if(!reg.test(str)){                alert("对不起,您输入的字符串类型格式不正确!");//请将“字符串类型”要换成你要验证的那个属性名称!            }            }    }     

//判断输入的字符是否为中文

function IsChinese()     {             var str = document.getElementById('str').value.trim();            if(str.length!=0){            reg=/^[\u0391-\uFFE5]+$/;            if(!reg.test(str)){                alert("对不起,您输入的字符串类型格式不正确!");//请将“字符串类型”要换成你要验证的那个属性名称!            }            }    }     

//判断输入的EMAIL格式是否正确

function IsEmail()     {             var str = document.getElementById('str').value.trim();            if(str.length!=0){            reg=/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/;            if(!reg.test(str)){                alert("对不起,您输入的字符串类型格式不正确!");//请将“字符串类型”要换成你要验证的那个属性名称!            }            }    }     

//判断输入的邮编(只能为六位)是否正确

function IsZIP()     {             var str = document.getElementById('str').value.trim();            if(str.length!=0){            reg=/^\d{6}$/;            if(!reg.test(str)){                alert("对不起,您输入的字符串类型格式不正确!");//请将“字符串类型”要换成你要验证的那个属性名称!            }            }    }     

//判断输入的数字不大于某个特定的数字

function MaxValue()     {         var val = document.getElementById('str').value.trim();            if(str.length!=0){            reg=/^[-+]?\d*$/;             if(!reg.test(str)){//判断是否为数字类型                if(val>parseInt('123')) //“123”为自己设定的最大值                {                     alert('对不起,您输入的数字超出范围');//请将“数字”改成你要验证的那个属性名称!                }             }        }    }     

Phone : /^(((\d{2,3}))|(\d{3}-))?((0\d{2,3})|0\d{2,3}-)?[1-9]\d{6,7}(-\d{1,4})?$/


Mobile : /^(((\d{2,3}))|(\d{3}-))?13\d{9}$/
Url : /^http:\/\/[A-Za-z0-9]+.[A-Za-z0-9]+[\/=\?%-&_~`@[]\’:+!]([^<>\”\”])$/


IdCard : /^\d{15}(\d{2}[A-Za-z0-9])?/QQ:/[19]\d4,8/


某种特殊金额:/^((\d{1,3}(,\d{3})*)|(\d+))(.\d{2})?$/ //说明:除“XXX XX,XXX XX,XXX.00”格式外

总结 : 花了一天多的时间基本了解了正则表达式的相关知识点 进行了总结 应该非常详细了 各个知识点都涉及到了 有实例代码

2 0
原创粉丝点击