Python 正则表达式匹配字符串中的http链接

来源:互联网 发布:淘宝法律专业自考通 编辑:程序博客网 时间:2024/05/20 02:55

利用Python正则表达式匹配字符串中的http链接。主要难点是用正则表示出http 链接的模式。

import repattern = re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+')    # 匹配模式string = 'Its after 12 noon, do you know where your rooftops are? http://tinyurl.com/NYCRooftops 'url = re.findall(pattern,string)print url>>['http://tinyurl.com/NYCRooftops']
原创粉丝点击