python 在pycharm中 爬虫
来源:互联网 发布:sql如何导入数据库 编辑:程序博客网 时间:2024/05/20 05:26
查了一些资料发现大部分的爬虫在liunx环境下运行,但本人想在windows下进行爬虫,好不容易把各种依赖装上了,但是如何在windows下pycharm中创建爬虫,以及调试和执行,进行了摸索。
参考了下面的两篇文章:
http://blog.csdn.net/ck4438707/article/details/52076220
http://blog.csdn.net/pleasecallmewhy/article/details/19642329
1.首先新建一个工程
并在工程里面建一个文件scrapyp.py,在文件中写入
from scrapy.cmdline import executeexecute()
在pycharm中点击右上角:edit configurations
则弹出如下框:
在红色箭头指示的位置,输入命名参数,创建一个爬虫,名称为tutorial,执行scrapyp.py文件。
在工程下面会出现如下结构:
到此一个基本的爬虫框架出来了,后面需要再各个模块添加内容。
下面来简单介绍一下各个文件的作用:
scrapy.cfg:项目的配置文件
tutorial/:项目的Python模块,将会从这里引用代码
tutorial/items.py:项目的items文件
tutorial/pipelines.py:项目的pipelines文件
tutorial/settings.py:项目的设置文件
tutorial/spiders/:存储爬虫的目录
在此文件中放入如下代码,并执行可以看到爬取的内容:
from scrapy import cmdlinecmdline.execute("scrapy crawl dmoz".split())
阅读全文
0 0
- python 在pycharm中 爬虫
- Scrapy爬虫框架(三):设置在 Pycharm 中Debug
- 当Python在gbk编码上遇到pycharm,爬虫问号乱码问题
- python爬虫环境安装-IDE-pycharm
- 在CentOS中部署Python和配置PyCharm开发环境
- 在CentOS中部署Python和配置PyCharm开发环境
- 以root权限在pycharm 中运行python 文件
- 在CentOS中部署Python和配置PyCharm开发环境
- 在pycharm中导入mysql-python时包没有
- 在python中配置opencv库,使用pycharm环境
- 在pycharm中导入mysql-python时包没有
- 在pycharm中切换python版本的方法
- 如何在PyCharm软件中设置使用的Python版本
- python在pycharm中代码格式化及快速注释
- python+selenium在Pycharm中使用alert报错问题解决
- 以root权限在pycharm 中运行python 文件
- 在pycharm中切换python版本的方法
- pycharm中python编码问题解决
- 详解SVN 的使用
- IDE搭建JFinal环境
- Python3 JSON 数据解析
- nginx日志中记录post数据
- linux contab 易错搞混设置时间
- python 在pycharm中 爬虫
- Hibernate 存储 中文乱码
- 微信网页授权
- CentOS6与CentOS7的差异对比
- html5之点击按钮3秒不能点击
- POJ 2488.A Knight's Journey
- Python 一个服务器监听多个客户端请求
- C 项目中混和使用C++
- 使用Z702构建摄像头+HLS图像处理模块+HDMI显示数据流工程