python3爬虫数据解析实战
来源:互联网 发布:北京工业大学 网络 编辑:程序博客网 时间:2024/06/04 22:10
如图所示,我想获取图片中画红框的src图片路径
这里我们用urlib请求下来数据,然后用BeautifulSoup解析数据
#python3from bs4 import BeautifulSoupimport urllib.requesturl='http://www.3jy.com'response=urllib.request.urlopen(url)#取右侧的一周热门排行的第一张图片html=response.read()#首先分析 是在body标签下的 class=main-right的div下#再一个class为wenzi_add的div的列表ul li # print(html)#接下来用BeautifulSoup解析html数据html=html.decode('utf-8')#python3soup=BeautifulSoup(html,'html.parser')div=soup.select('div[class=main-right]')div1=div[0]div2=div1.select('div[class=wenzi_add]')div3=div2[0]ul=div3.select('ul')ul1=ul[0]a=ul1.select('a')a1=a[0]img=a1.select('img')#将图片img对象转成list img[0] 然后获取其中的src属性img[0]['src']src=img[0]['src']print(src)# 获取url下的所有li标签中的urllist=[]for listr in ul1: a=ul1.select('li') a1=a[0] img=a1.select('img') src=img[0]['src'] list.append(src) print(list)
阅读全文
0 1
- python3爬虫数据解析实战
- Python3网络爬虫快速入门实战解析
- Python3.X 爬虫实战(动态页面爬取解析)
- 分享python3爬虫及数据分析实战视频教程
- python3系列-爬虫解析
- Python3网络爬虫快速入门实战解析(一小时入门 Python 3 网络爬虫)
- python3爬虫 - cookie登录实战
- python3爬虫实战(3)
- python3 爬虫 xicidaili.com 实战
- python3 [爬虫入门实战] 爬虫之爬取盘多多文档(百万数据)
- Python3.X 爬虫实战(静态下载器与解析器)
- [python3]nba球员数据爬虫
- python3 [爬虫入门实战]scrapy爬取盘多多五百万数据并存mongoDB
- python3 [爬虫入门实战]scrapy爬取盘多多五百万数据并存mongoDB
- python3爬虫(二)实战- 爬糗事百科
- Python3爬虫实战之爬取京东图书图片
- 爬虫实战之一--python3及pip安装
- 自己动手,丰衣足食!Python3网络爬虫实战案例
- pulltorefresh 上拉刷新 下拉加载
- HDU-2544-最短路
- hdu4497 GCD and LCM 容斥原理
- MapReduce再学习:资源管理框架YARN
- 小白成长记——Android进阶之线程thread的两种实现
- python3爬虫数据解析实战
- 【多媒体编解码】AAC
- 排序算法之堆排序
- HDU 1496 Equations(简单哈希)
- 如何利用Halcon中的快速傅里叶变换(FFT)
- 数据库系统原理(自考4、5、6、7)
- com.android.build.transform.api.TransformException
- Untiy 访问组件(二)
- 2017百度之星资格赛-1005 寻找母串