Python 爬虫学习1
来源:互联网 发布:圣思园java视频 编辑:程序博客网 时间:2024/05/21 10:34
from bs4 import BeautifulSoupimport requestsimport timeurl = 'http://www.tripadvisor.cn/Attractions-g60763-Activities-New_York_City_New_York.html'urls =['http://www.tripadvisor.cn/Attractions-g60763-Activities-oa{}-New_York_City_New_York.html#ATTRACTION_LIST'.format(str(i)) for i in range(0,1080,30)]def get_attractions(url , data=None): wb_data = requests.get(url) time.sleep(4) soup = BeautifulSoup(wb_data.text, 'lxml') titles = soup.select('div.property_title > a[target="_blank"]') imgs = soup.select('img[width="160"]') cates = soup.select('div.p13n_reasoning_v2 > a') for title , img , cate in zip(titles , imgs , cates): data = { 'title': title.get_text(), 'img': img.get('src'), 'cate': list(cate.stripped_strings) } print(data)for i in urls: get_attractions(i)
0 0
- Python 爬虫学习1
- Python爬虫学习1
- Python 爬虫学习1
- 学习Python之爬虫1
- 学习python爬虫笔记(1)
- Python爬虫学习笔记(1)-正则表达式
- Python 开发简单爬虫 学习笔记1
- python学习笔记(3)--爬虫基础教程1
- Python爬虫学习(1):百度贴吧
- Python爬虫学习1--糗事百科
- python 爬虫学习笔记(1)
- 学习python爬虫
- python 爬虫学习一
- Python爬虫学习
- Python爬虫学习
- python爬虫学习
- Python学习--爬虫
- python学习爬虫
- Learn python the hard way_习题32_循环和列表
- C++静态数据成员的引用
- 看了这些,你还能说你不理解GC原理?
- JavaScript代码规范和性能整理
- C++知识点15
- Python 爬虫学习1
- 480_android混淆
- 【机器学习】SVM学习(三):线性分类器的求解
- Android的死机、重启问题分析方法
- 谁先倒 (15分)
- 481_make sure class name exists错误
- 循环链表的判断
- 线性时间算法解决最大间隙问题
- 482_originally added here错误