Scrapy入门

来源：互联网发布：餐饮英语口语大全软件编辑：程序博客网时间：2024/04/29 08:30

本次将完成下列任务:
1.创建一个Scrapy项目
2.定义要提取的Item
3.编写爬取网站的spider并提取Item
4.编写Item Pipeline来存储提取到的Item(即数据)

一，创建一个Scrapy项目

在cmd中输入

md workspace

cd workspace

scrapy startproject tutorial

在e盘的workspace文件夹中就会出现一个名为tutorial的Scrapy项目

目录结构为：

tutorial/
    scrapy.cfg
    tutorial/
        __init__.py
        items.py
        pipelines.py
        settings.py
        spiders/
            __init__.py

其中

scrapy.cfg: 项目的配置文件
tutorial/: 该项目的python模块，之后将在此加入代码
tutorial/items.py: 项目中的item文件
tutorial/pipelines.py: 项目中的pipelines文件
tutorial/settings.py: 项目的设置文件
tutorial/spiders/: 放置spider代码的目录

二，定义要提取的Item

0 0

【scrapy】学习Scrapy入门
Scrapy入门--Scrapy是什么
<scrapy>scrapy入门学习
【scrapy】学习Scrapy入门
Scrapy入门
scrapy入门
Scrapy入门
Scrapy入门
Scrapy入门
Scrapy入门
scrapy入门
Scrapy 入门
scrapy入门
scrapy 入门
scrapy入门
Scrapy爬虫入门
scrapy入门基础一
Scrapy爬虫框架入门
黑客帝国屏保源码
C# Assembly
opencv的cvCvtColor问题
初级算法整理，选择排序法
UVA 11264 Fire!
Scrapy入门
activity 的onrestart（）方法总会被调用么
Map用来当做容器时，重复赋值，会将以前的值给覆盖掉。
cocos2d-x 3.6版连连看
codeevs 1069关押罪犯，关系并查集
在处理多线程引起的共享数据冲突问题上，非常规解决办法两种：
IDL视频教程
如何评价 IBM 收购 Blue Box 集团
Android学习系列--App调试内存泄露之Context篇