JAVA正则表达式

来源：互联网发布：算法心得编辑：程序博客网时间：2024/06/04 01:24

一：
\d 任意一个数字，0~9的任意一个
\w 任意一个字母或数字或下划线，也就是A~Z,a~z,0~9中任意一个
\s包括空格，制表符，换行符等空白字符的其中任意一个
. 小数点可以匹配任意一个字符（除了换行符）如果要匹配包括”\n”在内的z所有字符，一般用 [\s\S]

二：
自定义字符集合 [ ]匹配方式，能够匹配方括号中任意一个字符

[ab5@]匹配”a”或”b”或“5”或”@”
[^ abc]匹配“a”,”b”,”c”之外的任意一个字符
[f-k]匹配f~k之间的任意一个字母
[^A-F0-3]匹配A~F,0~3之外的任意一个字符

三：
–正则表达式的特殊符号，被包含到中括号中，则失去特殊意义，除了^,-之外。
__标准字符集合，除小数点外，如果被包含于中扩号，自定义字符集合，将包含该集合，比如：
[\d.-+]将匹配：数字，小数点，+,-

量词(Quantifier)
*修饰匹配次数的特殊符号
{n}表达式重复n次
{m,n}表达式至少重复m次，最多重复n次
{m,}表达式至少重复m次
? 匹配表达式0次或者1次，相当于{0,1}
+ 表达式至少出现1次，相当于{1,}

表达式不出现或出现任意次，相当于{0,}
*
匹配次数中的贪婪模式（匹配字符越多越好，默认！）

匹配次数中的非贪婪模式（匹配字符越少越好，修饰匹配次数的特殊符号后再加上一个?号）

\d{6}就是前面的\d重复6次
（\d\d）{6}就是重复了12次

字符边界
^:与字符串开始的地方匹配
$:与字符串结束的地方匹配
\b:匹配一个单词边界

\b:匹配这样一个位置：前面的字符和后面的字符不全是\w

正则表达式的匹配模式
IGNORECASE 忽略大小写模式
- - 匹配时忽略大小写
- - 默认情况下，正则表达式是要区分大小写的
SINGLELINE 单行模式
整个文本看走一个字符串，只有一个开头，一个结尾。
使小数点“.”可以匹配包含换行（\n）在内的任意字符
MULTILINE多行模式
每行都是一个字符串，都有开头和结尾
在指定了MULTILINE之后，如果需要仅匹配字符串开始和结束位置，可以使用\A和\Z

选择符和分组
分支结构：左右两边表达式之间“或”关系，匹配左边或者右边
（）捕获组：
（1）在被修饰匹配次数的时候，括号中的表达式可以作为整体被修饰
（2）取匹配结果的时候，括号中的表达式匹配到的内容可以被单独得到
（3）每一对括号会分配一个编号，使用（）的捕获根据左括号的顺序从1开始自动编号。捕获元素编号为零的第一个捕获是由整个正则表达式模式匹配的文本
（？：Expression），一些表达式中，不得不使用（），但又不需要保存（）中子表达式匹配的内容，这时可以用非捕获组来抵消使用（）带来的副作用。

反向引用：（\nnn）
每一对括号会分配一个编号，使用（）的捕获根据左括号的顺序从1在佛那个编号。
2.通过反向引用，可以对分组捕获的字符串进行引用。
预搜索（零宽断言）
1.(?=exe)：断言自身出现的位置的后面能匹配表达式exe
2.(?<=exe)断言自身出现的位置的前面能匹配的表达式exe
3.（?!exe）断言此位置的后面不能匹配表达式exe
这里写图片描述

阅读全文

0 0