windows下搭建爬虫框架scrapy
来源:互联网 发布:如何制作淘宝网店图片 编辑:程序博客网 时间:2024/05/18 00:18
摘要:
主要讲解在windows上搭建scrapy的步骤,该步骤已经在百度上搜索就是一大片的了,但是出于学习以及练习写博客的目的,我还是按照自己的思路写一遍。
最近开始使用python,然后看到忘了上很多人都在用python在抓网页,突然就想起了大学时想弄的网络蜘蛛,于是开始自己写代码,但是第一版做出来不合心意,感觉爬出去了就很难结束,并且想做定制还是比较麻烦。接着在q群众看到有人说使用scrapy来实现网络蜘蛛,于是就上网开始找资料了,终于经过了几个钟头的努力,终于有了成果,下面文章就是对这个搭建步骤的描述。
如果你是一个了解可能还是很熟悉的程序猿,那么下面所描述的内容可以直接忽略了;如果你对scrapy第一次听说,并且还有点兴趣学习的话,可以先登录官网http://scrapy.org/基本浏览一下,然后可以按照一面的步骤来完成环境的搭建。
第一步:当然是安装python了,本人安装的是2.7.3版本;可以到python的官网下载然后双击运行,一路“下一步”即可完成安装。安装好后,将python的安装目录添加到系统变量中,这样才能够在控制台中输入python进入,如下图所示则说明安装python成功了
第二步:按照官网的提示,我们先安装pywin32,在http://sourceforge.net/projects/pywin32/files/这里点击进去后选择对应的版本(注意要与安装的python版本对应),下载后也是双击运行,直接下一步一路完成。
第三步:安装twisted,在其官网的下载页面中http://twistedmatrix.com/trac/wiki/Downloads可以看到其还依赖几个包
1. 安装zope.interface, 从这里https://pypi.python.org/pypi/zope.interface#download下载
我选择了4.0.5版本,点击进去后,点击download按钮即可,下载完后也是双击运行,一路下一步即可完成。
打开cmd,进入python,按照下图显示输出的话表示正确安装了
2. 安装pyopenssl, 从这里https://pypi.python.org/pypi/pyOpenSSL下载,注意要选择对应python的版本。
我选择了倒数第二个,安装成功后通过下面的方式验证:
3. 安装twisted,在下载页面http://twistedmatrix.com/trac/wiki/Downloads中我们可以看到
选择对应python的版本下载安装。
第三步:安装lxml,在这里https://pypi.python.org/pypi/lxml/下载,本人选择了3.2.3版本
最后一步:安装scrapy
在安装前,请先将easytool安装好
在这里http://pypi.python.org/packages/2.7/s/setuptools/setuptools-0.6c11.win32-py2.7.exe下载,安装好后,需要将python安装目录下的Scripts目录路径添加到系统变量中,因为下面就要用到。
下载scrapy,在这里https://pypi.python.org/pypi/Scrapy下载,下载完后,解压出来,运行cmd,cd到该解压目录下,在cmd中输入
easy_install Scrapy
完成scrapy的安装,然后在cmd中输入scrapy进行验证,如果出现下图所示,则说明安装成功了
到此,整个环境搭建成功!
- windows下搭建爬虫框架scrapy
- windows下搭建爬虫框架scrapy
- windows下搭建爬虫框架scrapy
- windows下搭建爬虫框架scrapy
- windows系统下搭建爬虫框架scrapy
- windows下搭建爬虫框架scrapy
- Python网络爬虫1 ---- windows下搭建爬虫框架scrapy
- windows 7 下如何搭建爬虫框架scrapy
- Windows下搭建python2.7 爬虫框架Scrapy
- windows下安装scrapy爬虫框架
- Windows下Scrapy爬虫框架的安装
- Ubuntu14.0 64bit 下Scrapy爬虫框架的搭建
- windows配置Scrapy爬虫框架
- 在Windows下安装Scrapy网络爬虫框架
- Windows环境下安装Python的爬虫框架Scrapy
- Windows python3下安装scrapy爬虫框架的完美方案
- 在linux和windows下安装python爬虫框架scrapy
- CentOS上搭建Scrapy爬虫框架
- VS2010快速修改MFC的图标
- java 中JSON数据特殊字符的处理
- achartengine之折线图
- 利用CLI向Oracle NoSQL存数据----包含数组
- 4.多线程学习--操作线程的中断机制
- windows下搭建爬虫框架scrapy
- 织梦DedeCMS文章按日期时间归档分类插件
- query去两边空格,兼容ie
- 下载Youtobe视频
- Appium Android Bootstrap源码分析之控件AndroidElement
- 穿越NAT的p2p通信方法研究
- 数据库设计的东东
- 51单片机数码管驱动(汇编版)
- [ACM] HDU 3395 Special Fish (二分图最大权匹配,KM算法)