js基础正则表达式细解

来源:互联网 发布:在淘宝店上怎样上图 编辑:程序博客网 时间:2024/06/06 03:50

目标:
1,正则语法。
2,在IDE中使用正则处理规则复杂的字符串查找 ,替换需求
3,在js程序设计中使用正则表达式处理字符串。
一,正则表达式在文本文档中的简单操作:
Regular Expression使用单个字符串来描述,匹配一系列符合某个句法规则的字符串。(就是按照某种规则去匹配符合条件的字符串)
1,通配符
find./-name*.txt在当前目录下查找txt文件。
2,正则表达式图形工具:http://regexper.com,
访问不了的情况可以在GitHub上下载到本地用。(1下载代码到本地2需要有node环境,进入目录install安装。)

3,去掉http协议的jpg文件的协议头。
例如:http:\/\/.+.jpg 表示找到文件中的http协议头中的jpg文件。
.点表示任意字符,*星表示任意个数,\反斜杠是转义字符(符号冲突时需要用到反斜杠转义符)
分组替换:http:(\/\/.+.jpg),→$1或者\$1转义替换 →结果就是替掉了http。

4,日期替换
2006/02/03
test/07/sd
2016/05/06
1998-03-07
12345/23/45678
1234/23/45678
12345/23/45

正在写法:^\d{4}[/-]\d{2}[/-]\d{2}+表示结尾,\d表示数字,{数字}表示量词,[]中括号内表示或者(中括号内的其中一个)。

正则括号提取: ^(\d{4})/-/-2-31(表示第二组-第三组-第一组)。


二,正则在js对象中的操作:
js通过内置对象RegExp支持正则表达式:
有两种方法实例化RegExp对象
1,字面量
var reg=/\bis\b/g;(正则文本写在反斜杠之间,\b表示单词边界,边界内写内容,g代表global,匹配全文的意思)
定义正则表达式:
js中字符串的replace方法,可以查找替换,
2,构造函数方式
var reg=new RegExp(’\bis\b’,’g’)
(js中反斜杠本身就是特殊字符,所以需要用反斜杠进行转义,)
3,修饰符
g:global全文搜索,不添加g,搜索到第一个匹配停止。
i:ignore case忽略大小写,默认大小写敏感。
m:multiple lines表示多行搜索。
4,元字符
正则表达式由两种基本字符类型组成,
1,愿义文本字符,2,元字符
元字符是正则中有特殊含义的非字母字符 。
*+?¥^.|(){}[]
这里写图片描述

5,字符类:
①ab\t含义;字母ab和水平制表符对应
②需要匹配一系列特征的字符时,可以使用元字符[]中括号来构建一个简单的类。([abc]把字符a或b或c自定义归为一类,表达式可以匹配这类的字符)
字符类取反[^abc]
6,范围类:
[a-z]闭区间,
7,预定义类:
这里写图片描述

匹配一个ab+数字+任意字符 的字符串
ab\d.
8,边界匹配
\d就是单词边界
这里写图片描述
m表示多行匹配。
9,量词
这里写图片描述
10,贪婪模式和非贪婪模式
量词后边加?号即为非贪婪模式,尽可能少的匹配。
11,括号分组:
匹配字符串Byron连续出现3次的场景。
Byron{3}
12,反向引用:
1n 表示捕获分组,
13,忽略分组
需要在分组内加上?:
(?:Byron).(ok)
14,前瞻
正则从文本头部向尾部开始解析,文本尾部方向,成为“前”。
前瞻就是正则表达式匹配到规则的时候,向前检查是否符合断言。
js不支持后顾/后瞻
符合和不符合特定断言成为 肯定/正向 匹配和 否定/负向 匹配。
写法:
正向前瞻:exp(?=assert)例如/\w(?=\d)/g,’x’/
负向前瞻:exp(?!assert)

三。js对象属性:
global全文搜索,默认值false。
ignore case是否大小写敏感,默认值false。
multiple lines多行搜索,默认值false。
lastIndex:是当前表达式匹配内容的最后一个字符的下一个位置。
source:正则表达式的文本字符串。
js中正则表达式的两种方法(test和exec方法。):
1,test方法:
RegExp.prototype.test(str);
作用:用来测试字符串参数中是否存在匹配正则表达式模式的字符串。
返回值:true或flase。
由于lastIndex的原因,
2,exec方法

RegExp.prototype.exec(str);
作用:使用正则表达式模式对字符串执行搜索,并将更新全局RegExp对象的属性以反映匹配结果。
返回值:null或者数组。
数组中有两个额外属性:
Index声明匹配文字的第一个字符的位置
input存放被检索的字符串string。

3,非全局调用:
调用非全局的RegExp对象的exec()时,返回数组。
第一个元素是与正则表达式想匹配的文本,
第二个元素是与RegExpObject的第一个子表达式相匹配的文本(如果有的话)
第三个元素是与RegExp对象的第二个子表达式相匹配的文本(如果有的话),以此类推。
这里写图片描述
,可以用while循环来检测字符串,把每次的结果是从谁开始匹配的,匹配的位置,匹配的结果,里边的分组。常用。

var reg3=/\d(\w)(\w)\d/;var reg4=/\d(\w)(\w)\d/g;var ret=reg.exec(ts);console.log(reg3.lastIndex+'\t'+ret.index+'\t'+ret.toString());while(ret=reg4.exec(ts)){    console.log(reg4.lastIndex+'\t'+ret.index+'\t'+ret.toString());}

四,字符串对象:
stringl.protatype.search(reg)

0 0
原创粉丝点击