python爬取网页(简易)
来源:互联网 发布:颈椎牵引器 知乎 编辑:程序博客网 时间:2024/06/04 18:48
爬取的照片信息
from urllib import request
import re
def getResponse(url):
url_request = request.Request(url)
url_response = request.urlopen(url_request)
return url_response
def getjpg(data):
jpglist = re.findall(r'src="http.+?.jpg"',data)
return jpglist
http_response = getResponse("http://dzh.mop.com/")
data = http_response.read().decode('utf-8')
L = getjpg(data)
global n
n = 1
for jpginfo in L:
print(n,'------',jpginfo)
n=n+1
爬取网页信息
import urllib.request
url = "http://www.douban.com/"
request = urllib.request.Request(url)
response = urllib.request.urlopen(request)
data = response.read()
data = data.decode('utf-8')
print(data)
print(type(response))
print(response.geturl())
print(response.info())
print(response.getcode())
- python爬取网页(简易)
- python爬取网页
- Python 网页爬取
- python爬取网页(设置headers2)
- 用python爬取小说信息(简易版)
- python 爬取网页正文
- python 多线程网页爬取
- python爬取网页信息
- python爬取网页图片
- 学习python爬取网页
- Python爬取简单网页
- python爬取网页内容
- python爬取网页图片
- Python爬取网页数据
- Python爬取网页图片
- Python爬取网页图片
- python爬取HTML网页
- Python-爬取网页信息
- 酷比魔方 iwork10旗舰版恢复出厂设置遇到的问题
- 1049. 数列的片段和(20)
- React学习笔记_export和import总结
- MaxPointsOnALine
- POJ 1185:炮兵布阵
- python爬取网页(简易)
- 统计思维(实例3)——分布建模
- 1050. 螺旋矩阵(25)
- React学习笔记_安装nodejs
- [Alg]利用蒙特卡洛思想计算圆锥体积
- 蛇形(环形)数字打印学习笔记
- uoj34 多项式乘法【FFT or NTT】
- 行内元素的默认间距
- 浅谈过期数据在各种数据库中的删除