用于“查找和替换”的正则表达式(三)

来源:互联网 发布:外国人的懒惰程度知乎 编辑:程序博客网 时间:2024/05/16 00:54

下表列出了用于指定 Unicode 字符属性数据库中列出的通用类别的两个字母的缩写词。您可以在正则表达式字符集中使用这些缩写词。例如,表达式 [:Nd:Nl:No] 匹配任何类型的数字。

有关 Unicode 字符属性数据库的详细信息,请参见 Unicode Standard 5.0 Character Properties(Unicode Standard 5.0 字符属性)。

表达式语法说明大写字母:Lu匹配任何一个大写字母。

例如:

:Luhe 匹配“The”但不匹配“the”。

小写字母:Ll匹配任何一个小写字母。

例如:

:Llhe 匹配“the”但不匹配“The”。

词首大写字母:Lt匹配将大写字母和小写字母结合的字符,例如,Nj 和 Dz。修饰符字母:Lm匹配字母或标点符号,例如逗号、交叉重音符和双撇号,用于表示对前一字母的修饰。其他字母:Lo匹配其他字母,如哥特体字母 ahsa。十进制数字:Nd匹配十进制数(如 0-9)和它们的双字节等效数。字母数字:Nl匹配字母数字,例如罗马数字和表意数字零。其他数字:No匹配其他数字,如旧斜体数字一。开始标点符号:Ps匹配开始标点符号,例如左方括号和左大括号。结束标点符号:Pe匹配结束标点符号,例如右方括号和右大括号。左引号:Pi匹配左双引号。右引号:Pf匹配单引号和右双引号。破折号:Pd匹配破折号标记。连接符号:Pc匹配下划线标记。其他标点符号:Po匹配 (,)、?、"、!、@、#、%、&、*、/、(:)、(;)、' 和 /。空白分隔符:Zs匹配空白。行分隔符:Zl匹配 Unicode 字符 U+2028。段落分隔符:Zp匹配 Unicode 字符 U+2029。无间隔标记:Mn匹配无间隔标记。组合标记:Mc匹配组合标记。封闭标记:Me匹配封闭标记。数学符号:Sm匹配 +、=、~、|、< 和 >。货币符号:Sc匹配 $ 和其他货币符号。修饰符号:Sk匹配修饰符号,如抑扬音、抑音符号和长音符号。其他符号:So匹配其他符号,如版权符号、段落标记和度数符号。其他控制:Cc匹配类似 TAB 和 NEWLINE 这样的 Unicode 控制字符。其他格式:Cf格式控制字符,例如双向控制字符。代理项:Cs匹配代理项对的一半。其他私用:Co匹配私用区域的任何字符。其他未分配字符:Cn匹配未映射到 Unicode 字符的字符。
原创粉丝点击