正则表达式匹配URL
来源:互联网 发布:excel删除重复数据公式 编辑:程序博客网 时间:2024/06/04 18:03
最近在做一些关于URL匹配的项目,本来对正则表达式了解的不多,上网搜索了好多前辈写的正则表达式,发现很少能被我使用的,现将我自己写的正则表达式贴出来,供大家参考。
%<本人做的是asp.net的项目,内容是阻止一个文本框中的某些URL>%
首先,正则表达式:
String check = @"((http|ftp|https)://)(([a-zA-Z0-9\._-]+\.[a-zA-Z]{2,6})|([0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}))(:[0-9]{1,4})*(/[a-zA-Z0-9\&%_\./-~-]*)?";
关于该正则表达式的说明:
①:该正则表达式匹配的字符串必须以http://、https://、ftp://开头;
②:该正则表达式能匹配URL或者IP地址;(如:http://www.baidu.com 或者 http://192.168.1.1)
③:该正则表达式能匹配到URL的末尾,即能匹配到子URL;(如能匹配:http://www.baidu.com/s?wd=a&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&inputT=1236)
④:该正则表达式能够匹配端口号;
阻止某些指定的URL:
如果我们在输入的文本框中要阻止http://www.baidu.com这个URL,传统的方法是用上面的正则表达式去匹配文本框中的URL,读出所有的URL之后在跟要阻止的URL去比较,但是这种方法有一个弊端,就是我们读出的URL是一直到子URL,而我们在配置文件中可能就写一个母URL,这样要对check出来的URL进行切割,加上网站默认的端口号是:80,我们要去比较端口号等等,我想出了一种新的方法:
从配置文件中读出要阻止的URL,组成一个正则表达式,去匹配文本框中,如果能够匹配到,则阻止掉。
配置文件中应该写:<add key="DomainCheckBlackUrl" value="baidu.com" />
在代码中实现:
现在一个正则表达式由3部分组成:
1:正则表达式的开头,可能由任意的字符组成;
2:正则表达式的中间部分:从配置文件中读出来的部分;
3:正则表达式的结尾部分:可能有一些子目录或者端口号等;
首先,从配置文件中读出URL:string[] serverlist = ConfigurationManager.AppSettings["DomainCheckBlackUrl"].Split(',');(配置文件中以“,”分割)
其次,string start = @"((http|ftp|https)://)([a-zA-Z0-9_-]+\.)*";(正则表达式的开头)
然后,正则表达式的结尾: end = @"(:[0-9]{1,4})?((/[a-zA-Z0-9\&%_\./-~-]*)|(?=[^a-zA-Z0-9\.]))";
组合之后的正则表达式: string check = start + @"((?<=[^a-zA-Z0-9])(" + CutStr + "))" + end;
以上是本人的一些小见解,希望对大家能有所帮助。
- 正则表达式匹配URL
- 正则表达式匹配url
- 匹配http url 正则表达式
- 超强匹配url地址的正则表达式
- c语言正则表达式匹配URL问题
- ios正则表达式匹配所有url
- 正则表达式 匹配URL或者网址
- 正则表达式匹配url的一种思路
- 正则表达式匹配域名、网址、url
- 正则表达式匹配URL或者网址
- Java正则表达式匹配URL中的host
- JavaScript中用正则表达式匹配URL
- 匹配URL的正则表达式解析
- Django中URL正则表达式匹配
- 正则表达式匹配URL或者网址
- javascript 正则表达式 一个 匹配和解析url的
- 比较强大的匹配URL的正则表达式
- 使用正则表达式来匹配URL或者网址
- 工作组和域
- 数制转换,将10进制转换为8进制 C语言 栈的应用
- MFC下通过OpenCV打开AVIA文件,有暂停功能
- 无法发起与 8080:80 (0.0.31.144) 的连接 - connect (22: 无效的参数)
- java获取WAS节点名称和服务名称
- 正则表达式匹配URL
- 等概率随机取样的c语言实现
- [AndEngine] Collision within TMX objects
- 邮箱的格式的测试用例
- Oracle服务的启动
- 遍历ResultSet,先记录,以后再查
- java LRUCache
- [AndEngine] Bug:Fix about onModifierFinish()
- jpa注解,两Dao之间相互调用时发生空指针异常,请大虾指点迷津,说一下原理赛