pyspider-例子之豆瓣top250
来源:互联网 发布:中国离婚率知乎 编辑:程序博客网 时间:2024/06/06 12:50
pyspider-例子之豆瓣top250
最近学习了pyspider,真是大神之作,简单易用,可视化UI,交互性不错,加之选择器的优秀耐用。使用它简单爬取了豆瓣网的top250,以下为代码:
代码块
#!/usr/bin/env python# -*- encoding: utf-8 -*-# Created on 2017-07-20 14:06:26# Project: douban# by:daiyangfrom pyspider.libs.base_handler import *import reclass Handler(BaseHandler): crawl_config = { } @every(minutes=24 * 60) def on_start(self): self.crawl('http://movie.douban.com/top250', callback=self.index_page) @config(age=10 * 24 * 60 * 60) def index_page(self, response): for each in response.doc('a[href^="http"]').items(): if re.match("https://movie.douban.com/top250", each.attr.href, re.U): self.crawl(each.attr.href, callback=self.detail_page) @config(priority=2) def detail_page(self, response): return { "url": response.url, "title": response.doc('html > body > div#wrapper > div#content > div.grid-16-8.clearfix > div.article > ol.grid_view > * > div.item > div.info > div.hd > a > span.title').text(), }
目录
用 [TOC]
来生成目录:
- pyspider-例子之豆瓣top250
- 代码块
- 目录
阅读全文
0 0
- pyspider-例子之豆瓣top250
- 爬虫学习--豆瓣top250
- Python3爬虫入门之爬取豆瓣Top250电影名称
- Python3之爬虫爬取豆瓣读书Top250
- python爬豆瓣电影Top250
- mathematica爬取豆瓣Top250
- Python爬虫豆瓣电影top250
- 豆瓣电影Top250基本信息抓取
- 豆瓣电影Top250基本信息抓取
- 豆瓣top250电影抓取(1)
- scrapy抓取豆瓣电影TOP250
- pyspider 爬豆瓣电影信息
- PHP篇之爬取豆瓣电影Top250的电影名
- 算法工程师如何改进豆瓣电影 TOP250
- 利用beautiful soup获取豆瓣top250
- python爬虫,爬豆瓣top250电影
- scrapy 抓取豆瓣Top250书籍信息
- Python爬取豆瓣电影top250
- idea创建scala项目
- Unity的animaition不能播放问题
- 日期时间 FUNCTION
- Myeclipse Server窗口抛异常
- Undefined external "macPib" ;Undefined external "MAC_MlmeSetReq::?relay" 等错误
- pyspider-例子之豆瓣top250
- POJ 1751 Highways
- SpringMVC —— DispatcherServlet 配置
- CodeForces
- C++ 均衡器使用
- Android 清理backstack
- QRPROM介绍
- myeclipse断点调试常用工具
- eclipse 中 操作 git