正则从网页中提取网址链接

来源:互联网 发布:python与自然语言处理 编辑:程序博客网 时间:2024/06/08 08:52

网上找的好多正则都不好使,自己写了一个简单的。

提取a标签里的href

<a\s+[^>]*href=['"]([^'"]*?)['"]\s[^>]*>(.*?)</a>

$(0) 整个 $(1) 链接 $(2) 内容


0 0
原创粉丝点击