Scrapy 命令的使用之一:全局命令
来源:互联网 发布:iphone4移动数据开关 编辑:程序博客网 时间:2024/05/22 12:03
startproject
要使用 startproject 这个命令,可以查看帮助,使用 -h
。
scrapy startproject -h
下面是在创建爬虫项目的时候,使用的一些参数示例:
scrapy startproject --logfile='../logf.log' douban
scrapy startproject --loglevel=DEBUG douban
scrapy startproject --nolog douban
fetch
示例:
scrapy fetch http://www.baidu.com
格式
scrapy fetch 网址 :显示出爬取对应网址的过程
使用 scrapy fetch -h
可以查看所有可以使用的 fetch 相关参数
--headers
:显示对应的爬虫爬取网页时候的头信息(代替 body 打印出来) --nolog
:控制不显示日志信息 --spider=SPIDER
参数来控制使用哪个爬虫
通过 --logfile = FILE
参数来指定存储日志信息的文件
通过 --loglevel = LEVEL
参数来控制日志等级
示例:
scrapy fetch --headers --nolog http://news.sina.com.cn/
runspider
首先,先写一个简单的爬虫文件,命名为 first.py,因为是全局命令,所以这个文件可以放在任何地方:
from scrapy.spiders import Spiderclass FirstSpider(Spider): name = 'first' allowed_domains = ["baidu.com"] start_urls = [ "http://www.baidu.com" ] def parse(self,response): print(response.body[:500]) print(response.url)
使用命令示例:
scrapy runspider --loglevel=INFO first.py
settings
在 Scrapy 项目之外使用 settings 命令,查看的是 Scrapy 默认配置信息。即 settings.py 文件里面键值对的信息。
scrapy settings –get BOT_NAME
scrapy settings –get SPIDER_MODULES
shell 命令(特别常用)
示例:
退出交互的命令是 exit()
。
version
scrapy version
scrapy version -v
view
view :下载某个网页并且用浏览器查看
使用示例:
scrapy view http://news.163.com
执行完这个命令以后,Scrapy 程序会自动打开浏览器,然后我们观察浏览器的文件地址,是一个本地文件的地址。
阅读全文
0 0
- Scrapy 命令的使用之一:全局命令
- scrapy 的命令使用
- scrapy 环境下命令的使用
- scrapy命令
- Scrapy的几个命令行命令
- VI的全局替换命令
- Ubuntu桌面版讨论使用全局菜单和取消的命令
- scrapy学习笔记--scrapy命令
- scrapy爬虫-------命令解析
- Python --- Scrapy 命令
- scrapy命令笔记
- 2.2 scrapy命令
- Scrapy命令小结
- 常用的Linux命令之一
- Vi中个的全局替换命令
- PReprocessor Macros : 全局宏命令的应用
- vi全局替换命令
- vim全局替换命令
- [SDOI2011]计算器 BSGS
- HDU 3061 Battle(最大权闭合图)
- 设计模式之三种工厂模式与实例详解
- 电商营销方式抢购,秒杀Redis原子减decr方法作为剩余库存判断条件的实现方式(1)
- Java 8 之 行为参数化
- Scrapy 命令的使用之一:全局命令
- inner join,left join和right join 的区别
- (noip 2015 斗地主)<搜索+贪心>
- 图形学(2)光栅图形学的直线绘制(上)
- ES6:解构赋值
- 2018京东前端笔试题笔试题
- JAVAEE之web基础知识
- 494. Target Sum
- 非常详细的 Docker 学习笔记