爬取网页的通用代码框架

来源:互联网 发布:c语言for循环语句 编辑:程序博客网 时间:2024/06/11 07:38
#-*- coding:UTF-8 -*-import requestsdef getHTMLText(url):    try:        r = requests.get(url, timeout = 30)        r.raise_for_status() #如果状态不是200,引发HTTPError异常        r.encoding = r.apparent_encoding        return r.text    except:        return '产生异常'if __name__ == '__main__':    url = 'http://www.baidu.com'    #url = 'www.baidu.com'    print getHTMLText(url)
阅读全文
0 0
原创粉丝点击