在文本中提取URL的正则表达式

来源:互联网 发布:月销售数据分析怎么写 编辑:程序博客网 时间:2024/05/16 04:55

\b((ftp|https?)://[-\w]+(\.\w[-\w]*)+|(?i:[a-z0-9](?:[-a-z0-9]*[a-z0-9])?\.)+(?-i:com\b|edu\b|biz\b|gov\b|in(?:t|fo)\b|mil\b|net\b|org\b|[a-z][a-z]\b))(:\d+)?(/[^.!,?;"'<>()\[\]{}\s\x7F-\xFF]*(?:[.!,?]+[^.!,?;"'<>()\[\]{}\s\x7F-\xFF]+)*)?


出自《
精通正则表达式

 

我修改了一下:

URLPattern = @"\b(?:(?:ftp|https?)://(?<domain>[-\w]+(?:\.\w[-\w]*)+)|(?<domain>(?i:[a-z0-9](?:[-a-z0-9]*[a-z0-9])?\.)+(?-i:com\b|edu\b|biz\b|gov\b|in(?:t|fo)\b|mil\b|net\b|org\b|[a-z][a-z]\b)))(?::\d+)?(([/;\?][A-Z0-9\.\-_/\.#%:;&=]+)+)?";

 

 

还有一种:

((https?|ftp)://|www[0-9]*?\.)(?<domain>([A-Z0-9\-]+\.)+[A-Z]{1,3})+(([/;\?][A-Z0-9\.\-_/\.#%:;&=]+)+)?

原创粉丝点击