python3爬虫初探(一)之urllib.request

来源:互联网 发布:php ipv6适配 编辑:程序博客网 时间:2024/06/06 06:32

#----第一把武器-----urllib.request---------

  urllib.request是python3自带的库(python3.x版本特有),我们用它来请求网页,并获取网页源码。话不多说,上代码。

复制代码
import urllib.request  #调入要使用的库url = 'http://www.baidu.com'data = urllib.request.urlopen(url)  #urlopen用来打开一个网页data = data.read()   #这里的rend()是必须的,否则不能打印源码。print(data)     #在python3里面print是要加括号的#b'<!DOCTYPE html><!--STATUS OK--><html><head><meta http-equiv="content-type" content="text/html;charset=utf-8"><meta http-equiv="X-UA-Compatible" content="IE=Edge"><meta content="always" name="referrer"><meta name="theme-color" content="#2932e1"><link rel="shortcut icon" href="/favicon.ico" type="image/#这是部分源码,现在已经成功走出第一步了,之后就是解析网页了。
阅读全文
0 0
原创粉丝点击