python爬取网页（简易）

来源：互联网发布：颈椎牵引器知乎编辑：程序博客网时间：2024/06/04 18:48

爬取的照片信息

from urllib import request
import re

def getResponse(url):
url_request = request.Request(url)
url_response = request.urlopen(url_request)

return url_response

def getjpg(data):
jpglist = re.findall(r'src="http.+?.jpg"',data)
return jpglist

http_response = getResponse("http://dzh.mop.com/")

data = http_response.read().decode('utf-8')
L = getjpg(data)

global n
n = 1
for jpginfo in L:
print(n,'------',jpginfo)
n=n+1

爬取网页信息

import urllib.request

url = "http://www.douban.com/"

request = urllib.request.Request(url)

response = urllib.request.urlopen(request)

data = response.read()

data = data.decode('utf-8')

print(data)

print(type(response))
print(response.geturl())
print(response.info())
print(response.getcode())

阅读全文

1 0

python爬取网页（简易）
python爬取网页
Python 网页爬取
python爬取网页（设置headers2）
用python爬取小说信息（简易版）
python 爬取网页正文
python 多线程网页爬取
python爬取网页信息
python爬取网页图片
学习python爬取网页
Python爬取简单网页
python爬取网页内容
python爬取网页图片
Python爬取网页数据
Python爬取网页图片
Python爬取网页图片
python爬取HTML网页
Python-爬取网页信息
酷比魔方 iwork10旗舰版恢复出厂设置遇到的问题
1049. 数列的片段和(20)
React学习笔记_export和import总结
MaxPointsOnALine
POJ 1185：炮兵布阵
python爬取网页（简易）
统计思维（实例3）——分布建模
1050. 螺旋矩阵(25)
React学习笔记_安装nodejs
[Alg]利用蒙特卡洛思想计算圆锥体积
蛇形（环形）数字打印学习笔记
uoj34 多项式乘法【FFT or NTT】
行内元素的默认间距
浅谈过期数据在各种数据库中的删除