菜鸟-爬取百度贴吧美图并保存
来源:互联网 发布:卡卡的淘宝店 编辑:程序博客网 时间:2024/05/22 05:14
from bs4 import BeautifulSoupimport randomimport osimport reimport requestsurl ='https://tieba.baidu.com/p/4814458788?pn='headers ={'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"}for i in range(1,53): page_url=url +str(i) html = requests.get(page_url , headers=headers) soup = BeautifulSoup(html.text, 'lxml') list = soup.select('img.BDE_Image') title = random.randint(1,10000) path = str(title).strip() os.makedirs(os.path.join("D:\patuw", path)) os.chdir("D:\patuw\\"+path ) for img in list: img_url = img.get('src') name = img_url[100:103] get_img =requests.get(img_url ,headers=headers ) f =open(name+'.jpg','ab') f.write(get_img.content ) f.close()
太菜,写了好久,代码也很烂,新手。
0 0
- 菜鸟-爬取百度贴吧美图并保存
- python爬虫学习-爬取百度贴吧图片并保存
- Python爬虫-利用百度地图API接口爬取数据并保存至MySQL数据库
- Scrapy爬取图片并保存
- scrapy 详细实例-爬取百度贴吧数据并保存到文件和和数据库中
- python 爬取csdn网页并保存博客到本地
- 简单的python爬取网页字符串内容并保存
- Scrapy爬取网页并保存到数据库中
- 豆瓣电影信息爬取并保存到excel
- 实战 使用scrapy 爬取代理 并保存到数据库
- 使用jsoup爬取数据并导出excel文件保存
- 每天自动爬取momentum壁纸并保存
- [python爬虫]--爬取mzitu.com的图片并保存
- 第一个小爬虫--爬取图片并保存
- 基于webmagic爬取并下载百度图片
- 龙珠直播前50信息爬取并保存图片和天池排名爬取
- python3爬虫 爬取图片,爬取新闻网站文章并保存到数据库
- PB从剪贴板取图并保存
- weblogic设置utf-8编码方式
- JavaWeb学习总结(五十三)——Web应用中使用JavaMail发送邮件
- 洛谷-多维动态规划-传纸条
- WebLogic使用总结(四)——WebLogic部署Web应用
- 割接
- 菜鸟-爬取百度贴吧美图并保存
- 设计和创建表间关系
- WebLogic使用总结(五)——Web项目使用Sigar在WebLogic服务器部署遇到的问题
- Android 开发中的接口文档
- SQL语句inner join 与left join的区别
- WebLogic使用总结(六)——WebLogic创建虚拟主机和修改启动端口号
- 2017/4/12
- WebLogic使用总结(七)——WebLogic部署Web应用并绑定域名
- hbase介绍