python3爬虫初探(一)之urllib.request
来源:互联网 发布:php ipv6适配 编辑:程序博客网 时间:2024/06/06 06:32
#----第一把武器-----urllib.request---------
urllib.request是python3自带的库(python3.x版本特有),我们用它来请求网页,并获取网页源码。话不多说,上代码。
import urllib.request #调入要使用的库url = 'http://www.baidu.com'data = urllib.request.urlopen(url) #urlopen用来打开一个网页data = data.read() #这里的rend()是必须的,否则不能打印源码。print(data) #在python3里面print是要加括号的#b'<!DOCTYPE html><!--STATUS OK--><html><head><meta http-equiv="content-type" content="text/html;charset=utf-8"><meta http-equiv="X-UA-Compatible" content="IE=Edge"><meta content="always" name="referrer"><meta name="theme-color" content="#2932e1"><link rel="shortcut icon" href="/favicon.ico" type="image/#这是部分源码,现在已经成功走出第一步了,之后就是解析网页了。
阅读全文
0 0
- python3爬虫初探(一)之urllib.request
- python3网络爬虫一《使用urllib.request发送请求》
- python爬虫基础知识(一)--Urllib.request
- python3爬虫攻略(1):urllib.request使用(1)
- python3爬虫攻略(2):urllib.request(2)
- python3 学习笔记之 urllib.request《一》 (urllib2 in python2)
- Python3.6 爬虫初体验--urllib、beautifulsoup(一)
- Python 3.4 - urllib.request 学习爬虫爬网页(一)
- python3爬虫初探(二)之requests
- python3爬虫初探(六)之EXCEL
- Python3.5爬虫urllib系列之三
- [Python3.x]网络爬虫(三):urllib.request抓资源的方式总结
- python3 urllib.request
- Python3:urllib.request详解
- [Python3.x]网络爬虫(一):利用urllib通过指定的URL抓取网页内容
- Python3 爬虫学习(一):urllib库的使用及简单的爬取
- python3爬虫初探(三)之正则表达式
- python3爬虫初探(四)之文件保存
- 数据从业者必备的一些网站和工具
- jenkins+svn+tomcat 配置自动部署流程
- 9月30日云栖精选夜读:阿里巴巴摘得LSVC桂冠 打造领先AI视频技术
- tomcat启动成功,访问tomcat主页显示404
- Silver Cow Party POJ
- python3爬虫初探(一)之urllib.request
- Socket详解
- leetCode_637_AverageOfLevelsInBinaryTree
- 搜索引擎优化是项目的开始,而不是结束的原因
- OLTP/OLAP
- 【分布式6】Zookeeper使用--Java API
- es6语法-解构赋值
- 初识Spring Boot框架(二)之DIY一个Spring Boot的自动配置
- ios开发之本地通知