JavaScript正则表达式

来源:互联网 发布:做微信淘客用什么软件 编辑:程序博客网 时间:2024/06/05 20:46


一、JS正则表达式简介

      1、正则表达式: Regular Expression 使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。

      2、正则表达式在线工具: regexper.com

           本地安装

      3、例子用符: \b is \b     ----------- 单词 is ,\b是 word boundary,单词边界

                          . --------- 任意字符;      \. -------- .  ;     \ / --------- / ; ( **** ) ---------- 分组;

                          \d --------- 数字 ;    \d{4} ----------- 4个数字 ;  [/-] -------- []是或者, / 或者-;

                          ^-----------开头 ;  $ ---------- 结尾;

                         $1 ---------    ;       $2-----------  ;     $3------------ 

二、认识正则表达式

     1、RegExp对象

         JS通过内置对象RegExp支持正则表达式;

         两种方法实例化RegExp对象: 字面量 和  构造函数

                字面量: var reg = / \bis\b/g;

                构造函数:var reg = new RegExp('\\bis\\b','g');

         例子用符: / *** /g ----------- g是全局搜索,不加就匹配第一个

                                   i ----------- ignore case ,忽略大小写,默认大小写敏感

                                   m --------- multiple lines 多行搜索

      2、元字符

          正则表达式由两种基本字符类型字符:

                   原以文本字符

                   元字符 ---------------- 在正则表示式中有特殊含义的非文本字符

                            . * + ? $ ^ | \  () {} []

                    \t------ 水平制表符      \n --------- 换行   \r ---------- 回车

      3、字符类

           一般情况下正则表达式一个字符对应字符串一个字符。

          我们可以使用元字符 [] 来构建一个简单的类;所谓类是指符合某些特性的对象,一个泛指,而不是特指某个字符;如 表达式 [abc] 把字符 a 或 b 或 c归为一类,表达式可以匹配这类的字符。

           字符类取反 : 使用元字符^创建 反响类/负向类。 [^abc]

      4、范围类

           正则表达式还提供了范围类;所以我们可以使用 [a-z]来连接两个字符表示 从a到z的任意字符,这是闭区间,包含a和z本身。

            在 [] 组成的类内部是可以连写的 [a-zA-Z0-9];

             - 的匹配正常用:[0-9-] -------- 匹配0~9或-;

       5、JS预定义类及边界

           预定义类:  . ----------------- 除回车和换行之外的所有字符

                            \d  ------- [0-9] ----------- 数字字符

                           \D ---------- [^0-9] ----------- 非数字字符

                           \s --------- [\t\n\r\f] ----------- 空白符

                          \S ----------- [^\t\n\r\f] ---------- 非空白符

                          \w ----------[a-zA-Z_0-9] ---------- 单词字符(数字、字母或下划线)

                           \W -------- [^a-zA-Z_0-9] ---------- 非单词字符

           边界匹配字符:

                   ^ ------------- 以 xxx 开始

                   $ ------------ 以 xxx 结束

                   \b ----------- 单词边界

                   \B -----------  非单词边界,如 'This is a boy'.replace(/\Bis\b/g,0);

       6、量词

                  ? -------- 出现0次或一次( 最多1次)

                  + --------  出现1次或多次 (最少1次)

                  * --------- 出现任意次

                  {n} --------  出现n次

                  {n,m} --------- 出现 n到m次

                   {n,} -------- 至少出现n次

                   {0,n} --------  最多n次

 

       7、贪婪模式与非贪婪模式

            贪婪模式:  \d{n,m} --------------- 尽可能多的匹配,m次

            非贪婪模式:  \d{n,m} ------------- 能匹配到n次就可以了,在量词后面加?

                             如: ‘123456789’.match(/\d{3,5}?/g)

       8、分组

                 Bayron{3} = Bayro + 'n{3}'  -------------- 是匹配的最后一个字母,不是单词,匹配单词需要分组

                 使用()进行分组 : (Bayron){3}   

                  或 :使用 | 达到或的效果 ---------         abc(d|e)123 : 匹配 abcd123 或abce123

                  反响引用:$1$2$3 ---------- 捕获分组,对单个无效

                                如 2015-12-26  改为 12/26/2015 : ‘2015-12-26’.replace(/(\d{4})-(\d{2})-(\d{2})/g,'$2/$3/$1');  

                  忽略分组: 不希望捕获某些分组,只需要在分组内加上?:就可以了:

                                   (?:Bayron).(ok)

          9、前瞻

              正则表达式从文本头部向尾部开始解析,文本尾部方向,称为“前”。

              前瞻就是在正则表达式匹配到规则的时候,向前检查是否符合断言[即是否符合附加条件];

                             后顾/后瞻方向相反,Javascript不支持后顾

             符合和不符合特定断言称为 肯定/正向 匹配 和 否定/负向 匹配

             正向前瞻 -------- exp(?=assert)

             负向前瞻 -------- exp(?!assert)

             例子: ‘a2*3’.replace(/\w(?=\d)/g,'X'); ----- 'X2*3'  意思是匹配的字符后面要是数字就替换

          10、JS对象属性

               global: 全文搜索,默认false

               ignore case: 是否忽略大小写敏感,默认false

               multiline: 多行搜索,默认false

               lastIndex: 是当前表达式匹配内容的最后一个字符的下一个位置

               source:正则表达式的文本字符串

           11、test和exec方法

                 RegExp.prototype.test(str): 用于测试字符串参数中是否存在匹配正则表达式模式的字符串,返回 true 或 false。

                注: test()的结果受lastIndex的影响,为false的重置。

                RegExp.prototype.exec(str):使用正则表达式模式对字符串执行搜索,并将更新全局RegExp对象的属性以反映匹配结果。返回 null 或 数组。数组属性:

               ------- index 声明匹配文本的第一个字符的位置

               ------  input 存放被检索的字符串 string

 

          12、字符串对象方法

               String.prototype.search(reg)

              search():用于检测字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串。

               方法返回第一个匹配结果index,查找不到返回-1。

               search()方法不执行全局匹配,它将忽略标志 g ,并且总是从字符串的开始进行搜索。

        

              String.prototype.match(reg)

              match()方法将检索字符串,以找到一个或多个与regexp匹配的文本;返回 null 或 数组。

              regexp是否具有标志 g 对结果影响很大,没有就执行一次。

             数组属性还是  index 和 input[存放正则表达式]

 

             String.prototype.split(reg)

             常用split()把字符串分割成字符数组,如: ‘a1f2g4g6’.split(/\d/g) ---- ['a','f','g','g']  以数字分割。

             String.prototype.replace(str,replaceStr)  ----------  第一个str可是 /正则表达式/g

             String.prototype.replace(str,function)   ,function参数的含义:

                  function会在每次匹配替换的时候调用,有四个参数:

                    1、匹配字符串

                    2、正则表达式分组内容,没有分组则没有该参数

                    3、匹配项在字符串中的index

                    4、原字符串

           例子: 字符串中数字+1

               ‘a1g2f3h4’.replace(/\d/g,function(match,index,origin){

                     return parseInt(match)+1;

              });

 

 

0 0
原创粉丝点击