javascript正则学习——给自己温故用

来源：互联网发布：西安交大网络教育学费编辑：程序博客网时间：2024/04/30 00:23

1.字面量
例子1：

var reg = /\bis\b/
var reg1 = /\bis\b/g

‘He is a boy. This is a dog.Where is she? '.replace(reg,'IS') ====> 结果 ‘He IS a boy. This is a dog.Where is she? '.replace(reg,'IS');
就只变了第一个is，没＋g只匹配第一个

‘He is a boy. This is a dog.Where is she? '.replace(reg1,'IS') ====> 结果 ‘He IS a boy. This IS a dog.Where IS she? '.replace(reg,'IS');
加了g就说全局搜索，能匹配到所有

2.构造函数
例子1：

var reg = new RegExp('\\bis\\b')
var reg1 = new RegExp('\\bis\\b','g')

‘He is a boy. This is a dog.Where is she? '.replace(reg,'IS') ====> 结果 ‘He IS a boy. This is a dog.Where is she? '.replace(reg,'IS');
就只变了第一个is，没＋g只匹配第一个

‘He is a boy. This is a dog.Where is she? '.replace(reg1,'IS') ====> 结果 ‘He IS a boy. This IS a dog.Where IS she? '.replace(reg,'IS');
加了g就说全局搜索，能匹配到所有

4.元字符
1.正则表达式由两种基本自负类型组成：
－原意文本字符例如：a就代表a abc就带表abc
－元字符例如： \b 不是代表反斜杠b 代表单词边界

2.元字符是正则表达式中由特殊含义的非字母字符
例如＊＋？ $ ^ . | \ () { } [ ]

字符

含义
\t
水平制表符
\v
垂直制表符
\n
换行符
\r
回车符
\0
空字符
\f
换页符
\cX
与x对应的控制字符(Ctrl+X)

5.字符类
1.一般情况下正则表达式一个字符对应字符串一个字符
2.表达式 ab\t 的含义是 a＋b＋ tab键由三则组成
3.我们可以使用元字符［］来构建一个简单的类
4.所谓类是指符合某些特性的对象，一个泛指，而不是特指某个字符
5.表达式［abc］把字符a或b或c归为一类，表达式可以匹配这类的字符
例子1:

'a1b2c3d4'.replace(/[abc]/g,'X') ====> 结果为： 'X1X2X3d4'

6.字符类取反
1.使用元字符 ^ 创建反向类／负像类
2.反向类的意思是不属于某类的内容
3.表达式［^abc］表示不是字符a或b或c的内容
例子1:

'a1b2c3d4'.replace(/[^abc]/g,'X') ====> 结果为： 'a1b2c3X4'

7.范围类
1.使用字符类匹配数字［0123456789］
2.正则表达式还提供了范围类
3.所我们可以使用［a-z］来链接两个字符表示从 a 到 z
4.这是给闭区间，也就是包含a和z本身
5.如果要匹配大小写字母都要匹配在[]组成的类内部是可以连写的[a-zA-Z]
例子1:

'a1b2d3x4z9'.replace(/[a-z]/g,'Q') ＝＝＝> 结果为： 'Q1Q2Q3Q4Q9'

'a1b2d3x4z9SDFAQWE'.replace(/[a-zA-Z]/g,'Q') ＝＝＝> 结果为： 'Q1Q2Q3Q4Q9QQQQQQQ'

'2016-09-12'.replace(/[0-9]/g,'A') ＝＝＝> 结果为：'AAAA-AA-AA'

'2016-09-12'.replace(/[0-9-]/g,'A') ＝＝＝> 结果为：'AAAAAAAAAA'

8.预定义类
1.正则表达式提供预定义类来匹配常见的字符类

字符

等价类
含义
.
[^\r\n]
除了回车符河换行符之外的所有字符
\d
[0-9]
数字字符
\D
[^0-9]
非数字字符
\s
[\t\n\x0B\f\r]
空白符
\S
[^\t\n\x0B\f\r]
非空白符
\w
[a-zA-Z_0-9]
单词字符（字母，数字下划线）
\W
[^a-zA-Z_0-9]
非单词字符

2.匹配一个 ab+数字＋人意字符的字符类
原本我们会这样写 ab[0-9][^\r\n] =====> 现在这样写 ab\d.

9.边界
1.正则表达式还提供了几个常用的边界匹配字符
字符

含义
^
以xxx开始
$
以xxx结束
\b
单词边界
\B
非单词边界

例子1:

'This is a boy'.replace(/is/g,'0'); ===============>结果： 'Th0 0 a boy';

'This is a boy'.replace(/\bis\b/g,'0') =============>结果：'This 0 a boy';

'This is a boy'.replace(/\Bis\b/g,'0') ========＝====> 结果：'Th0 is a boy';

'@123@abc@'.replace(/@./g,'Q') ================> 结果：‘Q23Qbc@’

'@123@abc@'.replace(/^@./g,'Q') ================> 结果：‘Q23@abc@’ 意思是以@.以开头的，这个点代表任意字符

'@123@abc@'.replace(/.@/g,'Q') ================> 结果：‘@12QabQ’

'@123@abc@'.replace(/.@$/g,'Q') ================> 结果：‘@123@abQ’

10.量词
1.我们希望匹配一个连续出现10次数字的字符串我们可能会这么写\d\d\d\d\d\d\d\d\d\d

字符

含义
?
出现零次或一次（最多出现一次）
+
出现一次或多次（至少出现一次）
*
出现零次或多次（任意次）
{n}
出现n次
{n,m}
出现n到m次
{n,}
至少出现n次

11.贪婪模式
1.正则表达式会尽可能多的匹配
例子1:

‘12345678’.replace('/\d{3,6}/g','X') ==========>结果：'X78'

12.非贪婪模式

1.让正则表达式尽可能少的匹配，也就是说一旦成功匹配不再继续尝试就是非贪婪模式
2.做法很简单，在两次后加上？即可

例子1：
'12345678'.replace('/\d{3,6}?/g','X')  ==========>结果：'XX78'
13.分组

1.匹配字符串byron连续出现3次的场景，会这么写byron{3},但这么写，只会 n 匹配3次，并非整个单词
2.使用（）可以达到分组的功能，使两次作用于分组。然后就可以这么写 (byron){3}

例子1：
'a1b2c3d4'.replace(/[a-z]\d{3}/g,'X') ===============>结果：'a1b2c3d4' 
'a1b2c3d4'.replace(/([a-z]\d){3}/g,'X') ===============>结果：'Xd4' 
'ByronCasper'.replace(/Byron|Casper/g,'X') ==============>结果：'XX'
'ByronsperByrCasper'.replace(/Byr(on|Ca)sper/g,'X') ==============>结果：'XX'
‘2015-12-25’.replace(/(\d{4})-(\d{2})-(\d{2})/g,'$1') ===========>结果：'2015'
‘2015-12-25’.replace(/(\d{4})-(\d{2})-(\d{2})/g,'$2') ===========>结果：'12'
‘2015-12-25’.replace(/(\d{4})-(\d{2})-(\d{2})/g,'$3') ===========>结果：'25'
‘2015-12-25’.replace(/(\d{4})-(\d{2})-(\d{2})/g,'$2/$3/$1')===========>结果：'12/25/2015'
14.忽略分组

1.不希望捕获某些分组，只需要在分组哪加上？：就可以（？：byron）.(ok)
意思是匹配上了，括号里的不会被$1获取
例子1:

'A1okB2ok'.replace(/(?:[A-Z]).(ok)/g,'B') ＝＝＝＝＝＝＝＝＝＝＝》结果："BB"

'A1okB2ok'.replace(/([A-Z]).(ok)/g,'$1$2')＝＝＝＝＝＝＝＝＝＝＝》结果："AokBok"

'A1okB2ok'.replace(/(?:[A-Z]).(ok)/g,'$1$2')＝＝＝＝＝＝＝＝＝＝＝》结果："ok$2ok$2" ps:(?:[A-Z]) 被忽略了，不能被$获取了

15.前瞻

1.正则表达式从文本头部向尾部开始解析，文本为不方向，称为前

2.前瞻就上在正则表达式匹配到规则的时候，向前检查是否符合断言，后顾／后瞻方向相反

3.javascript不支持后顾

4.符合和不符合特定断言称为肯定／正向匹配和否定／负向匹配

名称

正则
含义
正向前瞻
exp(?=assert)
负向前瞻
exp(?!assert)
正向后顾
exp(?<=assert)
javascript不支持
负向后顾
exp(?<!assert)
javascript不支持

例子1:
'a2*3'.replace(/\w(?=\d)/g,'X')=========>结果：'X2*3'
'a2*34v8'.replace(/\w(?=\d)/g,'X')=========>结果：'X2*X4X8'
'a2*34vv'.replace(/\w(?=\d)/g,'X')=========>结果：'X2*X4vv'
'a2*34vv'.replace(/\w(?!\d)/g,'X')=========>结果：'aX*3XXX'
15.对象属性
1. g: global全文搜索，不添加，搜索到第一个匹配停止默认 false

2. i: ignore case 忽略大小写，不添加，大小写就会区别开来默认 false

3. m: multiple lines 多行搜索默认 false

4. lastIndex:是当前表达式匹配内容的最后一个字符的下一个位置

5. source:正则表达式的文本字符串

对于i的例子：

'He is a boy .Is he?'.replace(/\bis\b/g,'0') ====> 结果 'He 0 a boy.Is he?';

'He is a boy .Is he?'.replace(/\bis\b/gi,'0') ====> 结果 'He 0 a boy.0 he?';

var muStr='@123
@456
@789'

muStr.replace(/^@\d/g,'Q') ====> 结果:
'Q123
@456
@789'
(为什么会是这样的结果，因为存在隐藏回车换行符的原因，所以就第一个被匹配了)

muStr.replace(/^@\d/gm,'Q') ====> 结果:
'Q123
Q456
Q789'

var reg1 = /\w/;
var reg2 = /\w/gim;

console.info(reg1.global )=============> '结果：false

console.info(reg1.ignoreCase )=============> '结果：false

console.info(reg1.multiline )=============> '结果：false

console.info(reg1.global )=============> '结果：false

console.info(reg1.source )=============> '结果："\w"

console.info(reg2.global )=============> '结果：true

console.info(reg2.ignoreCase )=============> '结果：true

console.info(reg2.multiline )=============> '结果：true

console.info(reg2.global )=============> '结果：true

console.info(reg2.source )=============> '结果："\w"

reg1.global = true //这些属性是只读的，不能更改

console.info(reg1) ===============>false;

16.test和exec的方法

1.RegExp.prototype.test(str)用于测试字符串参数中是否存在匹配正则表达式模式的字符串
如果存在则返回true，否则返回false

var reg = /\w/;
var reg1 = /\w/g;
console.info(reg.test('a')) =======>结果：true
console.info(reg.test('$')) =======>结果：false
console.info(reg.test('$')) =======>结果：false
console.info(reg.test('$')) =======>结果：false

console.info(reg1.test('ab')) =======>结果：true
console.info(reg1.test('ab')) =======>结果：true
console.info(reg1.test('ab')) =======>结果：false
console.info(reg1.test('ab')) =======>结果：true
console.info(reg1.test('ab')) =======>结果：true
console.info(reg1.test('ab')) =======>结果：false

while(reg2.test('ab')){
console.info(reg1.lastIndex);
}
结果为：
1
2

2.RegExp.prototype.exec(str) 使用正则表达式模式对字符串执行搜索，并将更新全局RegEx对象的数学已反映匹配结果
如果没有匹配的文本则返回null，否则返回一个结果数组
还有两个额外的属性
－ index 声明匹配文本的第一个字符的位置
－ input 存放被检索的字符串 string
返回的数组
第一个元素是与正则表达式想匹配的文本
第二个元素是 RegExpObject 的第一个字表达式相匹配的文本（如果有的话）
第二个元素是 RegExpObject 的第二个字表达式相匹配的文本（如果有的话），以此类推

例子1:
var reg1 = /\d(\w)(\w)\d/;
var reg2 = \/d(\w)(\w)\d/g
var str = '*1az2bb3cy4dd5ee'

var ret = reg1.exec(str);
console.info(reg1.lastIndex+'\t')+ret.index+'\t'+ret.toString());

console.info(reg1.lastIndex+'\t')+ret.index+'\t'+ret.toString());

console.info(ret)

结果：
"0 1 1az2,a,z"
"0 1 1az2,a,z"
["1az2","a","z"]
ps:非全局调用lastIndex都是0

while(ret=reg2.exec(str)){
console.info(reg2.lastIndex+'\t')+ret.index+'\t'+ret.toString());
}

结果：
"5 1 1az2,a,z"
"11 7 3cy4,x,y"

17.字符串对象方法
var reg1 = /\d(\w)\d/
var reg2 = /\d(\w)\d/g
var ts ='*1a2b3c4d5e'

var ret = ts.match(reg1);
console.info(ret);
console.info(ret.index+'\t'+reg1.lastIndex);

结果：
["1a2","a"]
"1 0"

var ret = ts.match(reg2);
console.info(ret);
console.info(ret.index+'\t'+reg2.lastIndex);

结果：
["1a2","3c4"]
"undefined 0"

1.String.prototype.split(reg)
我们经常使用split 方法吧字符串分割为字符数组
'a,b,c,d'.split(','); //['a','b','c','d']
在一些复杂的分隔情况下我们可以使用正则表达式解决
'a,b,c,d'.split(/\d/); //['a','b','c','d']

2.String.prototype.replace(reg)
String.prototype.replace(str,replaceStr)

String.prototype.replace(reg,replaceStr)

String.prototype.replace(reg,function)
function 参数含义
1.匹配字符串
2.正则表达式分组内容，没有分组则没有该参数
3.匹配项在字符串中的index
4.原字符串

例子1:
'a1b1c1'.replace('1',2)==========>结果：'a2b1c1'

'a1b1c1'.replace(/1/,2)==========>结果：'a2b1c1'

'a1b2c3d4'.replace(/\d/g,function(match,index,origin){
console.info(index);
return parseInt(match)+1
})
结果：
1
3
5
7
"a2b3c4d5"

例子2:
'a1b2c3d4'.replace(/(\d)(\w)(\d)/g,function(match,group1,group2,group3,index,origin){
console.info(match);
return group1+group3
})

结果：
"1b2"
"3d4"
"a12c34"

最后这是我所学这篇文章的视频网站，有兴趣的人，可以去看看

http://www.imooc.com/video/12538
console.info(reg1.test('ab')) =======>结果：false

1 0

javascript正则学习——给自己温故用

1.字面量

2.构造函数

4.元字符

1.正则表达式由两种基本自负类型组成：

2.元字符是正则表达式中由特殊含义的非字母字符

5.字符类

1.一般情况下正则表达式一个字符对应字符串一个字符

2.表达式 ab\t 的含义是 a＋b＋ tab键 由三则组成

3.我们可以使用元字符［ ］来构建一个简单的类

4.所谓类是指符合某些特性的对象，一个泛指，而不是特指某个字符

5.表达式［abc］把字符a或b或c归为一类，表达式可以匹配这类的字符

6.字符类取反

1.使用元字符 ^ 创建 反向类／负像类

2.反向类的意思是不属于某类的内容

3.表达式 ［^abc］表示不是字符a或b或c的内容

7.范围类

1.使用字符类匹配数字［0123456789］

2.正则表达式还提供了范围类

3.所我们可以使用［a-z］来链接两个字符表示从 a 到 z

4.这是给闭区间，也就是包含a和z本身

5.如果要匹配大小写字母都要匹配在[]组成的类内部是可以连写的[a-zA-Z]

8.预定义类

1.正则表达式提供 预定义类 来匹配常见的字符类

2.匹配一个 ab+数字＋人意字符 的字符类

原本我们会这样写 ab[0-9][^\r\n] =====> 现在这样写 ab\d.

9.边界

1.正则表达式还提供了几个常用的边界匹配字符

10.量词

1.我们希望匹配一个连续出现10次数字的字符串 我们可能会这么写\d\d\d\d\d\d\d\d\d\d

11.贪婪模式

1.正则表达式会尽可能多的匹配

12.非贪婪模式

1.让正则表达式尽可能少的匹配，也就是说一旦成功匹配不再继续尝试就是非贪婪模式

2.做法很简单，在两次后加上？即可

13.分组

1.匹配字符串byron连续出现3次的场景，会这么写byron{3},但这么写，只会 n 匹配3次，并非整个单词

2.使用（）可以达到分组的功能，使两次作用于分组。然后就可以这么写 (byron){3}

14.忽略分组

1.不希望捕获某些分组，只需要在分组哪加上？：就可以（？：byron）.(ok)

意思是匹配上了，括号里的不会被$1获取

15.前瞻

1.正则表达式从文本头部向尾部开始解析，文本为不方向，称为前

2.前瞻就上在正则表达式匹配到规则的时候，向前检查是否符合断言，后顾／后瞻方向相反

3.javascript不支持后顾

4.符合和不符合特定断言称为 肯定／正向 匹配和 否定／负向 匹配

15.对象属性

1. g: global全文搜索，不添加，搜索到第一个匹配停止 默认 false

2. i: ignore case 忽略大小写，不添加，大小写就会区别开来 默认 false

3. m: multiple lines 多行搜索默认 false

4. lastIndex:是当前表达式匹配内容的最后一个字符的下一个位置

5. source:正则表达式的文本字符串

16.test和exec的方法

1.RegExp.prototype.test(str)用于测试字符串参数中是否存在匹配正则表达式模式的字符串

如果存在则返回true，否则返回false

2.RegExp.prototype.exec(str) 使用正则表达式模式对字符串执行搜索，并将更新全局RegEx对象的数学已反映匹配结果

如果没有匹配的文本则返回null，否则返回一个结果数组

还有两个额外的属性

－ index 声明匹配文本的第一个字符的位置

－ input 存放被检索的字符串 string

返回的数组

第一个元素是与正则表达式想匹配的文本

第二个元素是 RegExpObject 的第一个字表达式相匹配的文本（如果有的话）

第二个元素是 RegExpObject 的第二个字表达式相匹配的文本（如果有的话），以此类推

17.字符串对象方法

1.String.prototype.split(reg)

我们经常使用split 方法吧字符串分割为字符数组

'a,b,c,d'.split(','); //['a','b','c','d']

'a,b,c,d'.split(/\d/); //['a','b','c','d']

2.String.prototype.replace(reg)

String.prototype.replace(str,replaceStr)

String.prototype.replace(reg,replaceStr)

String.prototype.replace(reg,function)

function 参数含义

1.匹配字符串

2.正则表达式分组内容，没有分组则没有该参数

3.匹配项在字符串中的index

4.原字符串

2.表达式 ab\t 的含义是 a＋b＋ tab键由三则组成

3.我们可以使用元字符［］来构建一个简单的类

1.使用元字符 ^ 创建反向类／负像类

3.表达式［^abc］表示不是字符a或b或c的内容

1.正则表达式提供预定义类来匹配常见的字符类

2.匹配一个 ab+数字＋人意字符的字符类

1.我们希望匹配一个连续出现10次数字的字符串我们可能会这么写\d\d\d\d\d\d\d\d\d\d

4.符合和不符合特定断言称为肯定／正向匹配和否定／负向匹配

1. g: global全文搜索，不添加，搜索到第一个匹配停止默认 false

2. i: ignore case 忽略大小写，不添加，大小写就会区别开来默认 false