利用urllib和beautiful soup下载网页图片

来源：互联网发布：上海行知小学招生简章编辑：程序博客网时间：2024/05/11 04:55

以百度贴吧为例

from urllib import request

import re
from bs4 import BeautifulSoup
import urllib

i = 0
html = request.urlopen(r'http://tieba.baidu.com/p/4380912114?pn=1').read()
soup = BeautifulSoup(html,"html.parser")
img_ = soup.find_all(name='img')
img_list = []
for each in img_:
    now_pic = each.get('src')
    if 'forum' in now_pic:
        img_list.append(now_pic)
for each_img_url in img_list:
    try:
        request.urlretrieve(each_img_url,r'C:\Users\asus\Desktop\新建文件夹\%s.jpg'%i)
        i+=1
        print(each_img_url)
    except:
        pass

0 0

利用urllib和beautiful soup下载网页图片
利用urllib下载图片
Beautiful Soup 提取网页
python3利用beautiful soup获取网页文本及src链接和http链接
python Beautiful Soup分析网页
Beautiful Soup 4解析网页
网页解析器和beautiful soup 实例测试
4、利用Request和Beautiful Soup抓取指定URL内容
[python][urllib] 下载网页上的图片
使用 Beautiful Soup 解析网页内容
Python网页抓取之Beautiful Soup
网页正文提取工具Beautiful Soup
python Beautiful soup网页解析-星座网
Python网页抓取工具Beautiful Soup面面观！
利用beautiful soup获取豆瓣top250
Python利用Beautiful Soup抓取新闻标题
Beautiful Soup
Beautiful Soup
mongodb启动不了：child process failed, exited with error number 100
【Android进度条】三种方式实现自定义圆形进度条ProgressBar
spring之spring mvc的DispatcherServlet
Nginx + Tomcat 服务器集群架构及调优心得小结
java的List排序
利用urllib和beautiful soup下载网页图片
dstat-多功能的系统资源统计工具
reflux+react web 第四种写法
HTTP认证方式
Nginx+Tomcat+Memcached集群
String 转json
.Jar存放的位置
ListView中convertView和ViewHolder的工作原理
JAVA-单例模式之性能探究