提高正则表达式效率的方法
来源:互联网 发布:道德经在国外知乎 编辑:程序博客网 时间:2024/06/01 15:41
- 让匹配更快失败,尤其是匹配很长的字符串时,匹配失败的位置要比成功的位置多得多。
- 以简单、必须的字元开始,排除明显不匹配的位置,如锚点(^或$),特殊字符(x或\u263A)字符类([a-z]或\d之类的速记符),和单词边界(\b);尽量避免使用分组、选择、重复量词开头,如/one|two/、\s、\s{1,}等。
- 使用量词模式时,尽量让重复部分具体化,让字元互斥,如用”[^"\r\n]*”代替”.*?”(这个依赖回溯)。
- 减少分支数量、缩小分支范围,用字符集和选项组件来减少分支的出现,或把分支在正则上出现的位置推后,把分支中最常出现的情况放在分支的最前面。cat|bat -> [cb]at;red|read -> rea?d;red|raw -> r(?:ed|aw);
- (.|\r|\n) -> [\s\S]
- 精确匹配需要的文本以减少后续的处理,如果需要引用匹配的一部分,可使用捕获,然后通过反向引用来处理。
- 暴露必需的字元,用/^(ab|cd)/而不是/(^ab|^cd)/。
- 使用合适的量词,基于预期的回溯数量,使用合适的量词类型。
- 把正则表达式赋值给变量以便复用和提升提升性能,这样可以让正则减少不必要的编译过程。while (/regex1/.test(str1)) {/regex2/.exec(str2);…}用下面的代替上面的 var regex1 = /regex1/,regex2 = /regex2/;while (regex1.test(str1)) {regex2.exec(str2);…}
- 将复杂的正则表达式拆分成简单的片段,每个正则只在上一个成功的匹配中查找,更高效,而且可以减少回溯。
- 使用非捕获组,因为捕获组需要消耗时间和内存来记录反向引用,并不断更新,如果不需要反向引用,可用非捕获组(?:…)代替捕获组(…);当需要全文匹配的反向引用时,可用regex.exec()返回的结果或者在替换字符串是使用$&。
1 0
- 更多提高正则表达式效率的方法
- 提高正则表达式效率的方法
- 正则表达式的效率
- 善用Pattern提高你的应用处理正则表达式的效率(Java)
- 提高sql效率的方法
- 提高数据库效率的方法
- 提高查询效率的方法
- 提高数据库效率的方法
- 正则表达式的效率与优化
- 提高PHP的运行效率的方法
- 提高PHP的运行效率的方法
- 提高传参效率的简单方法
- 提高GDI+绘制效率的一些方法
- 提高数据库查询效率的实用方法
- 提高数据库查询效率的实用方法
- 实现提高PHP效率的集中方法
- 高效提高分页效率的方法
- 提高SQL查询效率的常用方法
- 黑马程序员-面向对象
- java统计字符串中字符及子字符串个数
- Lua学习 2) —— Android与Lua互调
- 数据降维工具箱drtoolbox
- android 库备注
- 提高正则表达式效率的方法
- 敏捷开发之Scrum扫盲
- 数学之美番外篇:平凡而又神奇的贝叶斯方法
- Thinkphp 自动生成页码 分页显示
- 1009. 说反话 (20)
- eclipse Authentication error. svn: Authorization failed
- scp:通过ssh复制文件到远程服务器
- s3c2440的中断
- OCP 1Z0 053 123