scrapy 爬虫入门
来源:互联网 发布:历史 知乎 编辑:程序博客网 时间:2024/05/16 17:28
1.安装scrapy 环境
cmd 命令执行conda install scrapy 即可2.创建项目
scrapy startproject spider_name3.构建爬虫(一个工程中可以存在多个spider, 但是名字必须唯一(进入到E:\spider_name\spider_name\spiders再构建))
scrapy genspider garlic http://www.51garlic.com/hq/list-139.html4.查看当前项目内有多少爬虫
scrapy list5.执行爬虫
scrapy crawl garlic -o abc.csv6.编写的爬虫代码garlic.py
# -*- coding: utf-8 -*-import scrapyclass GarlicSpider(scrapy.Spider):name = "garlic"start_urls=["http://www.51garlic.com/hq/list-139.html", "http://www.51garlic.com/hq/list-139-2.html",]def parse(self, response):for href in response.css('.td-lm-list a::attr(href)'):full_url = response.urljoin(href.extract())yield scrapy.Request(full_url,callback=self.parse_question)def parse_question(self, response):yield {'title':response.css('.td-timu').extract()[0].encode('utf-8'),'txt':response.css('.td-nei-content').extract()[0].encode('utf-8'),'link': response.url,}
阅读全文
0 0
- Scrapy爬虫入门
- Scrapy爬虫框架入门
- 网页爬虫--scrapy入门
- 网页爬虫--scrapy入门
- Python Scrapy爬虫入门
- scrapy 爬虫入门
- scrapy爬虫入门
- scrapy爬虫框架入门实例
- scrapy 爬虫入门(1)
- scrapy爬虫框架入门实例
- 使用scrapy编写爬虫入门
- 网络爬虫Scrapy框架入门
- Python爬虫入门-scrapy爬取拉勾网
- scrapy爬虫框架入门实例
- 爬虫Scrapy-02入门程序
- Python 爬虫入门 1 了解爬虫Scrapy
- python爬虫框架Scrapy入门:安装
- scrapy 爬虫 环境搭建入门(一)
- nagios监控内存
- windows下redis集群配置
- python2 和 python3 的区别
- Spring Batch 批处理框架介绍
- 设计模式-享元模式
- scrapy 爬虫入门
- tomcat启动项目名是根据??
- MongoDB安装与入门使用
- vue2 ssr 服务端渲染入门demo
- ES6 —(Generator 函数的异步应用)
- ajax学习
- leetcode 407. Trapping Rain Water II
- Hive学习笔记 --- Hive创建分区表
- Unity/UI —— 使用字符图片自定义字体(Custom Font)