Python3.6爬取网站图片
来源:互联网 发布:图片放大器 js 编辑:程序博客网 时间:2024/06/10 14:45
最近几天在学习python,写了个简单的爬虫程序:
成功运行代码的前提是安装了Python需要的第三方库,以下是代码:
# -*- coding:utf8 -*-import osimport reimport requests as rqimport urllibfrom bs4 import BeautifulSoup#下载图片def getHtml2(): html = rq.get(urls).text soup = BeautifulSoup(html,"html.parser")#文档对象 for k in soup.find_all('a',class_="tit"):#获取class为tit的a标签 print(k) addr = re.compile('<a class="tit" href="(.*?)"') url = re.findall(addr,repr(k))[0] #创建路径文件夹名称 cate_name = re.findall('<a .*?>(.*?)</a>',repr(k),re.S|re.M)[0] path = 'C:/data/images\\%s' % cate_name # 创建文件目录 os.mkdir(path) # 切换到该目录 os.chdir(path) #print(url) for x in range(1,20): url1 = url.split(".html")[0]+"_"+str(x)+".html" html1 = rq.get(url1).text soup1 = BeautifulSoup(html1,"html.parser")#文档对象 image = soup1.find_all('img')[0] print(image) res_url = r"(?<=src=\").+?(?=\")|(?<=src=\').+?(?=\')" img_url = re.findall(res_url ,repr(image), re.I|re.S|re.M)[0] urllib.request.urlretrieve(img_url, '%s.jpg' % x) #prython3.6写法def main(): print("开始解析网页===>") global urls urls = "http://www.58gc.cn/brjr/" getHtml2() print("网页解析结束===>")main()
阅读全文
0 0
- Python3.6爬取网站图片
- python3 爬取网站图片
- Python3爬取图片
- Python3.6 爬取网页图片
- python3爬取1024图片
- python3爬虫 爬取图片,爬取新闻网站文章并保存到数据库
- 爬取网站图片
- python3简单爬虫 (爬取各个网站上的图片)
- Python3 之 爬取网站页面
- python3 爬虫--网页图片爬取
- Python3 根据关键字爬取百度图片
- python3 爬虫 爬取美女图片
- python爬取网站图片
- Python爬取网站图片
- Python3 大型网络爬虫实战 003 — scrapy 大型静态图片网站爬虫项目实战 — 实战:爬取 169美女图片网 高清图片
- python3爬取新闻网站的所有新闻-新手起步
- 【Python3.6爬虫学习记录】(一)爬取简单的静态网页图片
- 【Python3.6爬虫学习记录】(四)爬取百度贴吧某帖子内容及图片
- 链表的使用
- 触发器的使用(应用场景:定时任务)
- Introducing Complex Event Processing (CEP) with Apache Flink
- 绝对定位相对定位的区别
- Yii中的booster.widgets.TbSelect2的操作
- Python3.6爬取网站图片
- 6-2 使用函数累加由n个a构成的整数之和
- JPA注解查询视图错误
- 零初始化
- VC++中改变Static Text字体的大小
- 使用YASM编程
- git学习使用
- css实现border半透明backround-clip
- 使用VS Code 搭建 基于ASP.NET Core 2的MVC应用