crawl spider的使用

来源:互联网 发布:淘宝的淘龄是怎么算的 编辑:程序博客网 时间:2024/05/16 12:19

1.创建一个爬虫项目:

scrapy startproject news_spider

1.1 进入到项目目录里面 cd news_spider

2.创建一个爬虫

scrapy genspider -t crawl 爬虫名 域名
scrapy genspider -t crawl china_report “www.chinareports.org.cn”

3.参数介绍

1.allow_domains 允许的域名,这个一般删掉。
2.start_urls 起始的url

原创粉丝点击