JavaScript正则表达式
来源:互联网 发布:淘宝店铺隐藏优惠券 编辑:程序博客网 时间:2024/06/04 19:14
之前好一段时间,自己很抵触“正则表达式”。一是,对其了解甚浅,不能很完整的掌握;再者,觉得好多需要正则的,要不网上可以找到,要不可以使用其他方式去实现。总之,对于正则毫无心得。
最近,看完了《JavaScript忍者秘籍》这本书,对正则有了全新的认识,自己也尝试了总结了一些,在开发中,让好多事情变得事半功倍。
正则表达式是一个拆分字符串并查询相关信息的过程。
正则表达式通常被称为一个模式(pattern),是一个用简单方式描述或者匹配一系列符合某个语法规则的字符串。
一、创建正则表达式
ECMAScript通过RegExp类型来支持正则表达式。
1. 字面量创建正则表达式
- 1
- 1
2. 构造函数创建
- 1
- 1
- g:表示全局(global)模式,即模式将被应用于所有字符串,而非在发现第一个匹配项时立即停止;
- i:表示不区分大小写(case-insensitive)模式,即在确定匹配项时忽略模式与字符串的大小写;
- m:表示多行(multiline)模式,即在到达一行文本末尾时还会继续查找下一行中是否存在与模式匹配的项。
注意:在开发过程中,如果正则是已知的,则优先选择字面量语法;而构造器方式则是用于运行时,通过动态构建字符串来构建正则表达式。
二、RegExp实例属性
RegExp每个实例都具有下列属性,通过这些属性可以取得有关模式的各种信息。
- global:布尔值,表示是否设置了g标志.
- ignoreCase:布尔值,表示是否设置了i标志.
- multiline:布尔值,表示是否设置了m标志.
- lastIndex:整数,表示开始搜索下一个匹配项的字符位置,从0算起.
- source:正则表达式的字符串表示,按照字面量形式而非传入构造函数中的字符串模式返回.
示例1:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
三、RegExp实例方法
1. exec()
exec()接受一个参数,即要应用模式的字符串,然后返回包含第一个匹配项信息的数组;或者在没有匹配项的情况下返回null。
返回的数组虽然是Array的实例,但包含两个额外的属性:index和input。
其中index表示匹配项在字符串的位置,而input表示应用正则表达式的字符串。
注意:在数组中,第一项是与整个模式匹配的字符串,其他项是与模式中的捕获组匹配的字符串(如果模式中没有捕获组,则该数组只包含一项)。
示例1:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
示例2:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
2. test()
test()接受一个字符串参数。在模式与该参数匹配的情况下返回true;否则,返回false。
注意:在只想知道目标字符串与某个模式是否匹配,但不需要知道其文本内容的情况下,使用这个方法非常方便。
示例:
- 1
- 2
- 3
- 4
- 5
- 1
- 2
- 3
- 4
- 5
示例:不包含“ligang”
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
四、正则表达式进阶
1. 精确匹配
如果一个字符不是特殊字符或者操作符,则表示该字符必须在表达式中出现。
示例:
- 1
- 2
- 3
- 1
- 2
- 3
注意:要想只允许匹配test,需/^test$/
2. 匹配一类字符
很多时候,我们不想匹配一个特定的字符,而是想匹配一个有限字符集中的某一个字符。可以通过“[]”来实现。
示例:
- 1
- 2
- 3
- 1
- 2
- 3
3. 转义
如果我们需要匹配[、$、^、]等特殊字符,在正则中,使用反斜杠可以对任意字符进行转义,让被转义的字符作为本身进行匹配。
示例:
- 1
- 2
- 1
- 2
4. 匹配开始和匹配结束
如果正则表达式第一个字符是“^”,则表示要从字符串的开头进行匹配。如果正则表达式最后一个字符是“$”,则表示必须出现在字符串的结尾。
- 1
- 2
- 3
- 1
- 2
- 3
5. 重复出现
- 1
- 2
- 3
- 4
- 5
- 6
- 1
- 2
- 3
- 4
- 5
- 6
补充:
这些重复操作符可以是贪婪的
或非贪婪的
。默认情况下是贪婪的。
在操作符后面加一个问号(?),可以让该表达式变成非贪婪的:进行最小限度的匹配。
示例:
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
6. 预定义字符类
- \t 水平制表符
- \b 空格
- \f 垂直制表符
- \r 换页符
- \n 回车
7. 分组
使用“()”可以进行分组,当正则表达式有一部分用括号进行分组时,它具有双重责任,同时也创建所谓的捕获。
8. 或操纵符(OR)
可以用“|”表示或的关系
示例:
- 1
- 1
9. 反向引用
在反斜杠后面加一个要引用的补货数量,该数字从1开始。
示例:
- 1
- 1
可以任意一个以“d”、“t”、“n”开头,且后面跟着一个“a”字符,最后跟着和第一个捕获相同的字符。
注意:
- 1
- 1
上述二者不同!!!
补充:在匹配XML类型的标签元素很有用!
- 1
- 1
五、捕获匹配的片段
1. 执行简单的捕获
旧版浏览器声明的透明度规则如下:filter:alpha(opacity=50);
通过正则获取其透明度的值:
- 1
- 2
- 3
- 4
- 5
- 1
- 2
- 3
- 4
- 5
注意:match返回的数组的第一个索引值总是该匹配的完整结果,然后是每个后续捕获结果。
2. 用全局表达式进行匹配
示例1:
- 1
- 2
- 3
- 1
- 2
- 3
示例2:
- 1
- 2
- 3
- 1
- 2
- 3
说明:
示例1为非全局匹配,返回结果同上述“获取其透明度的值”,只是其包含了两个捕获。
示例2为全局匹配,返回全局匹配结果,而不是每个匹配的捕获结果。
3. 捕获的引用
可以引用捕获到的匹配结果的两种方式:一是,自身匹配;二是,替换字符串。
方式一:上述“反向引用”已提及,/<(\w+)>(.+)<\/\1>/; // <a>click me</a>
方式二:将驼峰变量变为用中划线替换,这在AngularJS等框架中太常见。
如:ngClick –> ng-click
- 1
- 2
- 3
- 4
- 5
- 1
- 2
- 3
- 4
- 5
4. 没有捕获的分组
小括号有双重责任:不仅要进行分组操作,还可以指定捕获。
如果正则表达式中存在大量的分组,就会引起很多不必要的捕获。
在开始括号后面加一个“?:”可以让其不进行捕获。
示例:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
六、利用函数进行替换
将正则表达式作为replace()方法的第一个参数时,导致在该模式的匹配元素(全局匹配的话,就是多个匹配元素)上进行替换,而不是在固定字符串上进行替换。
示例:
- 1
- 1
其最大的特性是可以接受一个函数作为替换值,而不是一个固定的字符串。函数的返回值是即将替换的值。
参数列表:
(1)匹配的完整文本
(2)匹配的捕获,一个捕获对应一个参数
(3)匹配字符在源字符串中的索引
(4)源字符串
示例:将横线替换成驼峰
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
由于全局正则在每一次成功匹配的时候都会调用这样的替换函数。这种技术甚至可以超越简单的机械替换,并且可以作为字符串遍历的一种手段。
示例:压缩查询字符串
如:将foo=1&foo=2&blah=3 –> foo=1,2&blah=3
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
《JavaScript高级程序设计》中提供了“提取URL的搜索字符串中的参数”的方法
如:当前浏览器地址为:http://blog.csdn.net/ligang2585116?a=1&b=2
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
使用上述方式实现:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
注意:上述获取搜索字符串参数的方法,都不能存在相同的key,如果有相同的key,需要求参照compress()方法进行处理!!
七、利用正则表达式解决常见问题
1. 修剪字符串
示例:修建字符串两头多余的空格
- 1
- 2
- 3
- 4
- 5
- 6
- 1
- 2
- 3
- 4
- 5
- 6
2. 匹配换行符
示例:匹配所有字符,包括换行符
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
最佳方案:用于匹配任何不是空白字符的字符,以及匹配任意一个空白字符,联合起来就是匹配所有字符。
3. Unicode
示例:匹配Unicode
- 1
- 2
- 1
- 2
4. 转义字符
示例:开发人员可能将元素的id值设置为form:update,我们只能通过转义来支持
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
补充:
支持正则表达式的字符串方法:
- search 检索与正则表达式相匹配的值。
- match 找到一个或多个正则表达式的匹配。
- replace 替换与正则表达式匹配的子串。
- split 把字符串分割为字符串数组。
- JavaScript 正则 正则表达式
- Javascript 正则表达式javascript
- javascript正则表达式,jquery正则
- javascript正则表达式,jquery正则
- javascript正则表达式,jquery正则
- javascript正则表达式,jquery正则
- JavaScript正则表达式
- JavaScript正则表达式
- javascript中的正则表达式
- JavaScript正则表达式
- javascript正则表达式
- [JavaScript]正则表达式学习
- JavaScript中的正则表达式
- JavaScript正则表达式- -
- javascript正则表达式
- JavaScript正则表达式
- Javascript正则表达式
- javascript 正则表达式总结
- 图片类型转换,如png转换为jpg
- DenseNet网络结构产生的.py文件出错解决
- gradle构建时跳过指定tests
- Eclipse 转 IntelliJ IDEA历程
- 机器学习中的特征工程总结
- JavaScript正则表达式
- 多线程&多进程解析:Python、os、sys、Queue、multiprocessing、threading
- python进阶-数据结构和算法
- MFC应用程序打包发布教程
- 一个野蛮生长的程序员
- Linux常用命令汇总补充
- 《操作系统》课程编译nachos问题与解决方法总结
- paint.setXfermode()的用法图
- MySQL添加字段和修改字段的方法