利用requests和BeautifulSoup完成抓取数据
来源:互联网 发布:香港奥海城mac在哪 编辑:程序博客网 时间:2024/06/16 09:27
from bs4 import BeautifulSoupimport requestsurl = 'https://book.douban.com/'wb_data = requests.get(url)soup = BeautifulSoup(wb_data.text,'lxml')titles = soup.select('#content > div > div.article > div.section.popular-books > div.bd > ul > li > div.info > h4')authors = soup.select('#content > div > div.article > div.section.popular-books > div.bd > ul > li > div.info > p.author')grades = soup.select('#content > div > div.article > div.section.popular-books > div.bd > ul > li > div.info > p.entry-star-small > span.average-rating')info=[]for title,author,grade in zip(titles,authors,grades): data = { 'title' :'《'+title.get_text()+'》', 'author':list(author.stripped_strings), 'grade' :grade.get_text() } print(data) info.append(data)for i in info: if float(i['grade']) > 8: print(i['title'],i['author'])'''#content > div > div.article > div.section.popular-books > div.bd > ul > li > div.info > h4#content > div > div.article > div.section.popular-books > div.bd > ul > li > div.info > p.author#content > div > div.article > div.section.popular-books > div.bd > ul > li > div.info > p.entry-star-small > span.average-rating
这些是标签层次'''
阅读全文
0 0
- 利用requests和BeautifulSoup完成抓取数据
- Python3之利用requests和BeautifulSoup抓取部分信息
- requests.get 和 bs4.BeautifulSoup
- requests和BeautifulSoup一些细节
- 百度POI数据抓取-BeautifulSoup
- requests和BeautifulSoup组合爬虫技术
- requests和BeautifulSoup中文编码转换心得
- [python]利用BeautifulSoup进行简单图片抓取
- BeautifulSoup+正则+Python 抓取网页数据
- Python结合BeautifulSoup抓取知乎数据
- 利用python3 requests和BeautifulSoup4抓取百度贴吧研究生录取通知书并展示
- 利用bs4和requests爬取股票历史交易数据
- python股票数据爬虫requests、etree、BeautifulSoup学习
- Requests+Beautifulsoup+re百度贴吧抓取实例(python3.4逐行解释)
- Python-Windows下安装BeautifulSoup和requests第三方模块
- 爬虫:用requests和BeautifulSoup爬取网上图片
- Python爬虫实例——基于BeautifulSoup和requests实现
- python Web爬取工具总结 1 :Requests和BeautifulSoup
- 并发编程5:Java 阻塞队列源码分析(下)
- 如何解决ueditor乱码问题
- Python pass 语句
- 影响图像/视频效果的几个因素 ——图像优化的点
- VisualSVN的使用
- 利用requests和BeautifulSoup完成抓取数据
- Appium升级
- 解决winpe安装不了win7系统详细图文教程
- 闭包和匿名函数
- Python selenium —— selenium与自动化测试成神之路
- virtualenv 分别创建Python2和Python3的虚拟空间
- python3中替换python2中cmp函数的新函数
- 原型设计真的对用户体验那么重要吗?
- PHP 无限分类