正则表达式(2)

来源:互联网 发布:php字符串默认编码 编辑:程序博客网 时间:2024/05/22 03:10

4常用的正则表达式

  常用的正则表达式主要有以下几种:

  匹配中文字符的正则表达式: [\u4e00-\u9fa5]

  评注:匹配中文还真是个头疼的事,有了这个表达式就好办了哦

  获取日期正则表达式:\d{4}[|\-|\.]\d{\1-\12}[|\-|\.]\d{\1-\31}?

  评注:可用来匹配大多数年月日信息。

  匹配双字节字符(包括汉字在内)[^\x00-\xff]

  评注:可以用来计算字符串的长度(一个双字节字符长度计2ASCII字符计1

  匹配空白行的正则表达式:\n\s*\r

  评注:可以用来删除空白行

  匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />

  评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力

  匹配首尾空白字符的正则表达式:^\s*|\s*$

  评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式

  匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*

  评注:表单验证时很实用

  匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*

  评注:网上流传的版本功能很有限,上面这个基本可以满足需求

  匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线)^[a-zA-Z][a-zA-Z0-9_]{4,15}$

  评注:表单验证时很实用

  匹配国内电话号码:\d{4}-\d{7}|\d{3}-\d{8}

  评注:匹配形式如 0511 - 4405222 021 - 87888822

  匹配腾讯QQ号:[1-9][0-9]\{4,\}

  评注:腾讯QQ号从1000 0 开始

  匹配中国邮政编码:[1-9]\d{5}(?!\d)

  评注:中国邮政编码为6位数字

  匹配身份证:\d{17}[\d|X]|\d{15}

  评注:中国的身份证为15位或18

  匹配ip地址:((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

  评注:提取ip地址时有用

  匹配特定数字:

  ^[1-9]\d*$ //匹配正整数

  ^-[1-9]\d*$ //匹配负整数

  ^-?[1-9]\d*$ //匹配整数

  ^[1-9]\d*|0$ //匹配非负整数(正整数 + 0

  ^-[1-9]\d*|0$ //匹配非正整数(负整数 + 0

  ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ //匹配正浮点数

  ^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ //匹配负浮点数

  ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ //匹配浮点数

  ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$ //匹配非负浮点数(正浮点数 + 0

  ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$ //匹配非正浮点数(负浮点数 + 0

  评注:处理大量数据时有用,具体应用时注意修正

  匹配特定字符串:

  ^[A-Za-z]+$ //匹配由26个英文字母组成的字符串

  ^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串

  ^[a-z]+$ //匹配由26个英文字母的小写组成的字符串

  ^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串

  ^\w+$ //匹配由数字、26个英文字母或者下划线组成的字符串

  评注:最基本也是最常用的一些表达式

  Function IsRegu(Regu,s)

  '正则表达式校验

  If Regu="" Then

  Exit Function

  End if

  Dim Re,Sre

  Set Re = New RegExp

  Re.Pattern = Regu

  Sre = Re.Test(s)

  If Sre = True Then

  IsRegu = True

  Else

  IsRegu = False

  End If

  End Function

  tmp=" "

  if (IsRegu("\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*",tmp )) =false then

  msgbox "E-mail地址不合法"

  FieldCheck#N=false

  end if

不同的语言(如PHPJAVA)、相同语言的不同类库(如来自SunJava Regular Expression类库跟Apache Jakarta的正则表达式类库)间,用法会有所差别,在使用的时候,要注意这些差别。

 

5Editplus等软件中正则替换技巧

正则表达式应用实例目录

  【1正则表达式应用——替换指定内容到行尾

  【2正则表达式应用——数字替换

  【3正则表达式应用——删除每一行行尾的指定字符

  【4正则表达式应用——替换带有半角括号的多行

  【5正则表达式应用——删除空行

  【6软件技巧——键盘记录的注意事项

  【7软件技巧——关闭文档标签的便捷方法

  【8软件技巧——如何去掉 EditPlus保存文本文件时的添加后缀提示?

  【9软件技巧——提示找不到语法文件的解决办法

  【10】软件技巧——设置editplus支持其它文字,如韩文

  【11】软件技巧——FTP上传的设置

  【12】软件技巧——如何禁用备份文件功能?

  【13】软件技巧——添加语法文件、自动完成文件、以及剪辑库文件

  【14】工具集成——编译器集成例子(JavaBorland C++Visual C++Inno SetupnsisC#

  【15】工具集成——Editplus调试PHP程序

  【16】工具集成——打造 PHP 调试环境()

  【17】在 WINPE 中集成 EDITPLUS

  【18】支持带UTF-8标记/不带UTF-8标记的文件

正则表达式应用实例

  【1】正则表达式应用——替换指定内容到行尾

  原始文本如下面两行

  abc aaaaa

  123 abc 444

  希望每次遇到“abc”,则替换“abc”以及其后到行尾的内容为“abc efg”

  即上面的文本最终替换为:

  abc efg

  123 abc efg

  解决:

  在替换对话框,查找内容里输入“abc.*”,替换内容输入为“abc efg”

  同时勾选正则表达式复选框,然后点击全部替换按钮

  其中,符号的含义如下:

  “.” =匹配任意字符

  “*” =匹配0次或更多

  注意:其实就是正则表达式替换,这里只是把一些曾经提出的问题加以整理,单纯从正则表达式本身来说,就可以引申出成千上万种特例。

  【2】正则表达式应用——数字替换

  希望把

  asdadas123asdasdas456asdasdasd789asdasd

  替换为:

  asdadas[123]asdasdas[456]asdasdasd[789]asdasd

  在替换对话框里面,勾选正则表达式复选框;

  在查找内容里面输入“([0-9])([0-9])([0-9])”,不含引号

  替换为:”里面输入“[\1\2\3]”,不含引号

  范围为你所操作的范围,然后选择替换即可。

  实际上这也是正则表达式的使用特例,“[0-9]”表示匹配09之间的任何特例,同样“[a-z]”就表示匹配az之间的任何特例

  上面重复使用了“[0-9]”,表示连续出现的三个数字

  括号用来选择原型,进行分组,替换时要用

  “\1”代表第一个“[0-9]”对应的原型,“\2”代表第二个“[0-9]”对应的原型,依此类推

  “[”“]”为单纯的字符,表示添加“[”“]”,如果输入其它\1\2\3其它,则替换结果为:

  asdadas其它123其它asdasdas其它456其它asdasdasd其它789其它asdasd

  功能增强:

  如果将查找内容“[0-9][0-9][0-9]”改为“[0-9]*[0-9]”,对应1 123 12345 ...

  大家根据需要定制

  相关内容还有很多,可以自己参考正则表达式的语法仔细研究一下

  【3】正则表达式应用——删除每一行行尾的指定字符

  因为这几个字符在行中也是出现的,所以肯定不能用简单的替换实现

  比如

  12345 1265345

  2345

  需要删除每行末尾的“345”

  这个也算正则表达式的用法,其实仔细看正则表达式应该比较简单,不过既然有这个问题提出,说明对正则表达式还得有个认识过程,解决方法如下

  解决:

  在替换对话框中,启用正则表达式复选框

  在查找内容里面输入“345$”

  这里“$”表示从行尾匹配

  如果从行首匹配,可以用“^”来实现,不过 EditPlus 有另一个功能可以很简单的删除行首的字符串

  a.选择要操作的行

  b.编辑-格式-删除行注释

  c.在弹出对话框里面输入要清除的行首字符,确定

  【4】正则表达式应用——替换带有半角括号的多行

  几百个网页中都有下面一段代码:

  <script LANGUAGE="JavaScript1.1">

  <!--

  htmlAdWH('93163607', '728', '90');

  //-->

  </SCRIPT>

  我想把它们都去掉,可是找了很多search & replace的软件,都是只能对一行进行操作。

  EditPlus打开几百个网页文件还是比较顺畅的,所以完全可以胜任这个工作。

  具体解决方法,在 Editplus中使用正则表达式,由于“(”“)”被用做预设表达式(或者可以称作子表达式)的标志,所以查找

  “<script LANGUAGE="JavaScript1.1">\n<!--\nhtmlAdWH('93163607', '728', '90'.);\n//-->\n</SCRIPT>\n”

  时会提示查找不到,所以也就无法进行替换了,这时可以把“(”“)”使用任意字符标记替代,即半角句号:“.”。替换内容为

  <script LANGUAGE="JavaScript1.1">\n<!--\nhtmlAdWH.'93163607', '728', '90'.;\n//-->\n</SCRIPT>\n

  在替换对话框启用正则表达式选项,这时就可以完成替换了

  补充:

  对( )这样的特殊符号,应该用\( \)来表示,这也是很标准的regexp语法,可以写为

  <script LANGUAGE="JavaScript1.1">\n<!--\nhtmlAdWH\('93163607', '728', '90'\);\n//-->\n</SCRIPT>\n

  【5】正则表达式应用——删除空行

  启动EditPlus,打开待处理的文本类型文件。

  、选择查找菜单的替换命令,弹出文本替换对话框。选中正则表达式复选框,表明我们要在查找、替换中使用正则表达式。然后,选中替换范围中的当前文件,表明对当前文件操作。

  、单击查找内容组合框右侧的按钮,出现下拉菜单。

  、下面的操作添加正则表达式,该表达式代表待查找的空行。(技巧提示:空行仅包括空格符、制表符、回车符,且必须以这三个符号之一作为一行的开头,并且以回车符结尾,查找空行的关键是构造代表空行的正则表达式)。

  直接在"查找"中输入正则表达式“^[ \t]*\n”,注意\t前有空格符。

  (1)选择从行首开始匹配查找内容组合框中出现字符“^”,表示待查找字符串必须出现在文本中一行的行首。

  (2)选择字符在范围中,那么在“^”后会增加一对括号“[]”,当前插入点在括号中。括号在正则表达式中表示,文本中的字符匹配括号中任意一个字符即符合查找条件。

  (3)按一下空格键,添加空格符。空格符是空行的一个组成成分。

  (4)选择制表符,添加代表制表符的“\t”

  (5)移动光标,将当前插入点移到“]”之后,然后选择匹配 0 次或更多,该操作会添加星号字符“*”。星号表示,其前面的括号“[]”内的空格符或制表符,在一行中出现0个或多个。

  (6)选择换行符,插入“\n”,表示回车符。

  替换为组合框保持空,表示删除查找到的内容。单击替换按钮逐个行删除空行,或单击全部替换按钮删除全部空行(注意:EditPlus有时存在全部替换不能一次性完全删除空行的问题,可能是程序BUG,需要多按几次按钮)。

  【6】软件技巧——键盘记录的注意事项

  EditPlus的键盘记录有些类似于 UltraEdit的宏操作,不过功能相对单一,录制的文件可编辑性较差。

  由于基本无法编辑录制的文件,所以录制的时候为了避免录制失败,推荐纯粹使用键盘操作,以下是比较关键的几个键盘组合:

  Ctrl+F =调出查找对话框

  Ctrl+H =调出替换对话框

  Alt+F4 =关闭作用,比如,关闭查找对话框、关闭替换对话框,等等

  其它键盘快捷键在帮助-快捷键列表里面可以很容易的查找到,这里就不细说了。

  【7】软件技巧——关闭文档标签的便捷方法

  右键单击文档标签工具条,弹出菜单中选择标签选项,选中用鼠标中间的按钮关闭,这里包括鼠标的滚轮。

  【8】软件技巧——如何去掉 EditPlus 保存文本文件时的添加后缀提示?

  如果你使用 EditPlus进行文本编辑,那么每次创建文本文件,编辑后保存时,尽管文件类型下拉列表中显示的是文本文件, EditPlus还是询问你是否添加".txt"后缀,是不是很烦?

  解决方法:

  在程序目录建立一个空的文件“template.txt”

  工具-参数设置-模板里面,单击添加按钮添加模板,菜单文本这里输入“Text”,浏览“template.txt”,之后确定即可

  文件-新建-text”,就可以建立一个空的文本文件,保存时,这个文件自动带有扩展名".txt",也就避免了令人头疼的确认

  模板设置文件名称为“template.ini”,如果和主程序同一路径,可以使用相对路径

  罗嗦了点,不过管用

  要自动创建带有某种后缀的文件,方法同上。

  【9】软件技巧——提示找不到语法文件 *.stx 的解决办法

  原因多为设置的语法文件不存在或者是路径设置不对。这是因为 EditPlus的语法是设置文件采用的是绝对路径,而在你设置了语法文件之后,再把程序复制到其它目录,因而导致 EditPlus无法找到该语法文件。

  解决办法:

  在主程序目录里,找到 Setting.ini这是 EditPlus存放语法的文件

  查找后缀为“.stx”“acp”的文本内容,或者查找带有驱动器符号的行,比如

  Syntax file=C:\Program Files\EditPlus 2\cpp.stx

  那么,就把”C:\Program Files\EditPlus 2\“替换成你当前软件的路径。

  其它提示找不到文件的解决方法同上

  【10】软件技巧——设置editplus支持其它文字,如韩文

  在editplus里打开文件,出来打开文件对话框;然后点击转换器后面的那个省略号,会出来自定义转换器对话框;在右边选择你需要的编码方式,添加到左边,然后点确定;最后在下拉框中选择需要的编码方式,然后打开文件即可。

  【11】软件技巧——FTP上传的设置

  文件->远程操作->FTP上传设置选项卡中设置好参数(子目录前面应该加“/”“/web/”),点击确定回到“FTP上传选项卡,然后点击上传即可;批量上传的设置类似。

  【12】软件技巧——如何禁用备份文件功能?

  在参数选择的文件选项页,禁用“'保存时自动创建备份文件选项

  【13】软件技巧——添加语法文件、自动完成文件、以及剪辑库文件

  要添加 *.STX(语法文件)或 *.ACP(自动完成文件):

  1.选择参数选择语法

  2.单击添加按钮,命名,在扩展名部分输入对应扩展名(不带“.”

  3.浏览/输入 STX(语法文件部分)以及 ACP(自动完成文件部分)。

  添加剪辑库文件(*.CTL

  复制相应 *.CTL文件到软件安装目录,重新启动 EditPlus,则系统自动识别。

  作者主页有很多语法自动完成文件下载,(地址见扩展阅读3

  【14】工具集成——编译器集成例子(JavaBorland C++Visual C++Inno Setupnsis

  在工具参数选择用户工具选项页设置,设置步骤

  设置组名称,这里也可以不设置

  单击添加工具应用程序按钮并进行如下设置

  各种类似"$(FilePath)"的参数可以在文本框右侧的箭头下拉菜单中获取,具体含义如下

  参数描述

  $(FilePath)文件路径(文件全名,含目录和文件名)

  $(FileDir)文件目录(不带文件名)

  $(FileName)文件名(不带目录)

  $(FileNameNoExt)不带扩展名的文件名(不带目录)

  $(FileExt)扩展名(当前文件)

  $(ProjectName)工程名称(当前工程名)

  $(CurLine)当前行号(光标位置处的行号)

  $(CurCol)当前列号(光标位置处的列号)

  $(CurSel)当前文本(插入当前选定文本)

  $(CurWord)当前单词(插入当前单词)

  $(WindowList)显示当前窗口列表并选择特定文件

  例子 1. Java编译器

  菜单文本:Java编译器

  命令:c:\java\bin\javac.exe

  参数:"$(FilePath)"

  初始目录:$(FileDir)

  捕获输出:开启

  要运行已编译的 Java类文件,你可以进行如下设置:

  菜单文本:Java

  命令:c:\java\bin\java.exe

  参数:$(FileNameNoExt)

  初始目录:$(FileDir)

  命令部分应当替换为实际的 Java 解释器的路径。

  例子 2. Borland C++

  菜单文本:Borland C

  命令:c:\bc\bin\bcc32.exe

  参数:-Ic:\bc\include -Lc:\bc\lib -n$(FileDir) $(FilePath)

  初始目录:c:\bc\bin

  捕获输出:开启

  例子 3. Visual C++

  菜单文本:Visual C++

  命令:c:\msdev\vc98\bin\cl.exe

  参数:"$(FilePath)"

  初始目录:$(FileDir)

  捕获输出:开启

  例子 4. Inno Setup

  菜单文本:编译 Inno

  命令:C:\Program Files\Inno Setup 4\Compil32.exe”

  参数:/cc $(FileName)

  初始目录:$(FileDir)

  捕获输出:开启

  例子 5. nsis

  菜单文本:编译 nsis

  命令:C:\NSIS\makensis.exe

  参数:$(FileName)

  初始目录:$(FileDir)

  捕获输出:开启

  例子 6. C#

  菜单文本:编译 C#

  命令:C:\WINDOWS\Microsoft dot NET\Framework\v1.0.3705\csc.exe

  参数:$(FileName)

  初始目录:$(FileDir)

  捕获输出:开启

  在上面设置中,在命令部分,必须使用系统中各自编译器的绝对路径。

  设置完毕后,你可以在工具菜单运行对应工具了,运行结果会显示在底部的输出窗口,你也可以通过快捷键(Ctrl + 0-9) 运行,或者是通过用户工具栏的快捷按钮运行。

  要运行已编译的 *.exe文件,你可以进行如下设置(此时可执行文件需要和编译文件同名):

  菜单文本:Run

  命令:$(FileNameNoExt)

  参数:

  初始目录:$(FileDir)

  【15】工具集成——Editplus调试PHP程序

  1:打开Editplus,选择"工具->配置用户工具..."菜单。

  2:在弹出的窗口中选择"添加工具->应用程序",给新程序起一个好记的名字,比如这里我们用"Debug PHP","菜单文本"中输入"Debug PHP"。点击"命令行"右边的按钮,找到你的php.exe所在的路径,例如这里是"c:\php\php.exe"。再点击"参数"右边的下拉按钮选择"文件路径",最后再把"捕获输出"前面的复选框选上。

  3:现在测试一下,新建一个php文件,按快捷键Ctrl+1可以激活刚才我们设置的工具(如果你设置了多个工具,快捷键可能会有所不同),现在你可以看到它已经能正常工作了。但是还有一点不太理想:如果你的PHP程序出错,在输出窗口会提示你第几行出错 ,单击这一行提示,Editplus老是提示你找不到某某文件,是否新建。接下下我们要修正这个功能。

  4:打开刚才用户工具设置窗口,找到刚才设置的"Debug PHP"工具。点击"捕获输出"复选框旁边的"输出模式"按钮,会弹出一个定义输出模式的窗体,把"使用默认输出模式"前面的复选框去掉,"正则表达式"这一项的文本框中输入" ^.+ in (.+) line ([0-9]+) "(不包括引号),细心的朋友可能会发现,这里使用的也正则表达式的语法。然后,在下面的"文件名"下拉菜单中选择"预设表达式 1",即上边正则表达式中的第一个参数,""下拉菜单项选择"预设表达式 2"""下拉项保持为空。然后保存设置。

  5:好了,现在再来试一下吧,双击出错的行数,Editplus就会自动激活出错文件,并把光标定位到出错行,是不是特别方便呢?!

  现在,Editplus经过我们的"改造",已经可以即时的调试PHP文件了,虽然还不是"可视化"界面的,但对于一些平常的小程序来查错还是非常好用的。Editplus真是不款不可多得的好工具,如果你有什么使用技巧,不要忘了大家一起分享哦。

  如果不能切换错误行号,请尝试作如下修改:by aukw@CCF

  1.php.inihtml_errors = Off打开

  //如果你不打开,3.中的表达式要修改

  2.参数改成:-q -f "$(FilePath)"

  //不加"符号的话文件名有空格的文件调试失败。

  //-q不输出html头信息,你去掉也行,不过调试时候你一般用不到那些header信息

  3." ^.+ in (.+) line ([0-9]+) "改成 "^.+ in (.+) on line ([0-9]+)$"

  //如果还是不行,请注意调试结果,自己修改表达式来取出文件名和行号

  【16】工具集成——打造 PHP 调试环境()

  1:把剪辑库定位在 PHP4 Functions上就可以在编辑时,利用[插入]->[匹配剪辑]命令,就可以自动完成末输入完整的 PHP 函数(或直接按 F2)

  2:类似上面,在选择部分文字后,同样可以自动完成。( F2)

  3:[参数选择]->[设置和语法]->PHP->自动完成,选择目录下的 php.acp文件,你可以定制自己的自动完成方式.

  4:想要即时预览文件,可在[参数选择]->[工具]->WEB服务器中添加本地目录,(注意不要加 http:// ,应是一个有效的站点)

  如:主机->localhost/php |根目录->D:\php

  主机->localhost/asp |根目录->D:\asp

  主机->localhost/cgi |根目录->D:\cgi

  完成设置后只要脚本文件位于这些目录下(子目录也没问题),就能够正确解释.

  5:各种语法和模板文件可以在官方网站获得(地址见扩展阅读3),可根据需要选用和编辑。

  6: Ctrl+F11可显示当前文件中的函数列表.

  7:添加各种用户工具.:

  启动MYSQL服务器管理工具->C:\mysql\bin\winmysqladmin.exe

  启动Apache服务器->C:\Apache\bin\Apache.exe -k start

  启动Apache服务器->C:\Apache\bin\Apache.exe -k stop (shutdown)

  8: DBG附带有一个 prof_results.php文件,可剖析 PHP程序的性能.

  虽不是真正的调试器,但已经够了.

  OK!经过改造后,是不是有点象一个 IDE什么?还差点,没有即时帮助...看我的,再来:

  9: php_manual_en.chm (最好是扩展帮助手册)加入到用户工具中,当遇到需要参考的关键字时,把光标定位其上,按下快捷键 Ctrl+1,看到了吗.

  在输入时有想不起来的函数名时,先按照第 1条的方法调出函数,然后...怎么样?

  以上有的是对于调试工具的设置,由于此类工具比较多,大家设置时参考以上的基本就差不多了,所以就不过多的列举了。

  【17】在 WINPE 中集成 EDITPLUS

  可以基于目前的bartpe做得WINPE中,菜单使用nu2menu制作

  默认位置为\programs\editplus\

  默认系统位置为光盘的 i386目录

  i386/system32 autorun.bat中添加外壳集成(系统右键)

  regedit /s %SystemDrive%\programs\editplus\REG.REG

  regsvr32 /s \programs\editplus\EPPSHELL.DLL

  (reg.reg保存了epp的工具栏信息,当然注册用户也可以放置注册信息)

  复制editplus安装包里面的文件到programs\editplus\,注意,如果有setting.ini,删掉该文件,在nu2menu里面加入以下句子(可以根据需要安排位于特定菜单条目下)

  <MITEM TYPE="ITEM" DISABLED="@Not(@FileExists(@GetProgramDrive()\Programs\EditPlus\editplus.exe))" CMD="RUN"

  FUNC="@GetProgramDrive()\Programs\EditPlus\editplus.exe">EditPlus文本编辑</MITEM>

  【18】支持带UTF-8标记/不带UTF-8标记的文件 Lei@DRL提出并测试

  这里Byte Order Mark翻译为标记/文件头/标签

  参数选择-文件-里面设置支持不带有UTF-8文件头的UTF8文件,我这里翻译标签为UTF-8文件头,如果复选该项,应该是保存为不带标签的Utf-8,如果不复选,应该是保存成带有BOMUTF-8

  这样就可以打开带签名的UTF-8文件,并且可以正常编辑,但是又不能打开不带签名的了,想要打开不带签名的还需要改回来...不过虽然有点麻烦,但是总算能用了

  1.验证用户名和密码:("^[a-zA-Z]\w{5,15}$")正确格式:"[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位;

  2.验证电话号码:("^(\d{3.4}-)\d{7,8}$")正确格式:xxx/xxxx-xxxxxxx/xxxxxxxx

  3.验证身份证号(15位或18位数字):("^\d{15}|\d{18}$");

  4.验证Email地址:("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$")

  5.只能输入由数字和26个英文字母组成的字符串:("^[A-Za-z0-9]+$") ;

  6.整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$

  7.只能输入数字:"^[0-9]*$"

  8.只能输入n位的数字:"^\d{n}$"

  9.只能输入至少n位的数字:"^\d{n,}$"

  10.只能输入m~n位的数字:。"^\d{m,n}$"

  11.只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"

  12.只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"

  13.只能输入有1~3位小数的正实数:"^[0-9]+(.[0-9]{1,3})?$"

  14.只能输入非零的正整数:"^\+?[1-9][0-9]*$"

  15.只能输入非零的负整数:"^\-[1-9][]0-9"*$

  16.只能输入长度为3的字符:"^.{3}$"

  17.只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"

  18.只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"

  19.只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"

  20.验证是否含有^%&',;=?$\"等字符:"[^%&',;=?$\x22]+"

  21.只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"

  22.验证URL"^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$"

  23.验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01""09""1""12"

  24.验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为;"01""09""1""31"

  .(小圆点)

  匹配除换行符号外的任意字符

  \w

  匹配字母、数字、下划线

  \s

  匹配任意空白字符

  \d

  匹配数字

  \b

  匹配单词的开始或结束

  ^

  匹配字符串的开始,或排除

  $

  匹配字符串的结束

  以上都是单个字符匹配

  如果要求匹配元字符中的符号,则需要加反斜杠。例如\+表示匹配加号

  wqe.eew.rtwqe\.eew\.rt*

  重复零次或多次

  +

  重复一次或多次

  ?

  重复零次或一次

  {n}

  重复n

  {n,}

  至少重复n

  {n,m}

  重复nm

  \d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}

  ^w{3}\..+\.\w+$

  []

  表示匹配中括号中的任一字符

  ()

  小括号内的为一个整体

  |

  前后两者任意匹配一种

  \(?0\d{2}[)-]?\d{8}

  (\(0\d{2}\)\d{8})|(0\d{2}-\d{8})|0\d{2}\d{8}

  \W:与\w相反

  \S:与\s相反

  \D:与\d相反

  \B:与\b相反

  [^something]:与[something]相反

  0\d{2}-\d{8}

  \b\w{6}\b

  ^\w+

  <a[^>]+>

  Windows98|Windows2000|WindosXP

  ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

  ^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

  ^\+?[1-9][0-9]*$^\-[1-9][]0-9“*$

  ^[A-Za-z]+$^[A-Z]+$^[a-z]+$

  ^[a-zA-Z]\w{5,15}$

6.启示

心得体会

  (1心中时刻保持新颖想法,尝试用各种新办法来解决遇到的问题。对于遇到的问题,在用常规的解决思路无法解决或不能很好解决的时间,可以大胆探索尝试采用新的方法或思路来解决问题,说大点就是创新!没有新思路估计今天的正则表达式还要等几百年才能露现人间。

  (2善于学习和借鉴前人的经验和成果,UNIX鼻祖Ken Thompson是什么样子的人?是被计算机界尊称为“UNIX之父的大师级别的人物,大师都在不断思考从其它学科、其它知识领域的工作成果,来改进自己的工作或程序,事实也证明这样做取得巨大结果和后来的深远影响是事先谁也无法预估到的,我们在做一些事情或研究的时间,是否也考虑学习大师的优秀习惯?

  (3学好数学、英语并保持对数学、英语的兴趣,数学也是人类几千年积累的智慧结晶,学习数学知识可以培养和训练人的思维能力。看这篇文章的朋友,我想很多都是计算机相关专业的朋友,至于数学和英语对于计算机学习和发展的重要性的道理,这里就不在多说,重在实践加持之以恒!

  (4养成独立思考的习惯。上学时候老师经常说人与动物的最大区别是人能思考。拉美洲有句关于思考的谚语是,不会思考的人是白痴,不肯思考的人是懒汉,不敢思考的人是奴隶。我想大家和我一样,既不愿做懒汉、奴隶,更不愿做白痴。所以相信正则分享网的朋友们一定会选择做一个会思、肯思、敢思的人。

正则表达式匹配规则

  一切从最基本的开始。模式,是正规表达式最基本的元素,它们是一组描述字符串特征的字符。模式可以很简单,由普通的字符串组成,也可以非常复杂,往往用特殊的字符表示一个范围内的字符、重复出现,或表示上下文。例如:

  ^once

  这个模式包含一个特殊的字符^,表示该模式只匹配那些以once开头的字符串。例如该模式与字符串"once upon a time"匹配,与"There once was a man from NewYork"不匹配。正如如^符号表示开头一样,$符号用来匹配那些以给定模式结尾的字符串。

  bucket$

  这个模式与"Who kept all of this cash in a bucket"匹配,与"buckets"不匹配。字符^$同时使用时,表示精确匹配(字符串与模式一样)。例如:

  ^bucket$

  只匹配字符串"bucket"。如果一个模式不包括^$,那么它与任何包含该模式的字符串匹配。例如:模式

  once

  与字符串

  There once was a man from NewYorkWho kept all of his cash in a bucket.

  是匹配的。

  在该模式中的字母(o-n-c-e)是字面的字符,也就是说,他们表示该字母本身,数字也是一样的。其他一些??表符等),要用到转义序列。所有的转义序列都用反斜杠(\)打头。制表符的转义序列是:\t。所以如果我们要检测一个字符串是否以制表符开头,可以用这个模式:

  ^\t

  类似的,用\n表示新行\r表示回车。其他的特殊符号,可以用在前面加上反斜杠,如反斜杠本身用\\表示,句号.\.表示,以此类推。

 

原创粉丝点击