python爬虫1

来源:互联网 发布:反汇编软件 编辑:程序博客网 时间:2024/05/21 09:43


学习使用requests模块进行爬虫


最简单的一句

import requestshtml = requests.get(url)print html.text

就可以得到源代码


有时候为了模仿浏览器行为进行对反扒进行反制,需要伪装头:

import requestshtml = requests.get(url,headers = headers)print html.text

在使用正则表达式提取需要的数据就可以了。


0 0
原创粉丝点击