Python3抓取页面图片

来源:互联网 发布:c语言数据库编程 编辑:程序博客网 时间:2024/05/16 19:11


import urllib
import urllib.request
import re

def getHtml(url):
    page=urllib.request.urlopen(url)
    html=page.read()
    return html

def getImg(html):
    html=html.decode('utf-8')
    reg=r'src="(.+?\.jpg)"'
    imgre=re.compile(reg)
    imglist=re.findall(imgre,html)
    return imglist

html=getHtml("http://creativedreams.me/#modal-genius-hunt")

print(getImg(html))


因为python3中findall数据类型用bytes类型,因此应在正则表达式成使用类型转换。

0 0
原创粉丝点击