scrapy安装方法(windows以及linux)
来源:互联网 发布:优化农业产业结构 编辑:程序博客网 时间:2024/06/06 15:54
scrapy是python编写的用来进行网络抓取的一个开源的框架。具体的介绍可以参见下面的连接:
scrapy--百度百科
scrapy官方网站
scrapy依赖许多的库文件,所以scrapy的安装比较的麻烦。下面我说下我的安装过程。
安装源的选择
一般情况下,scrapy以及依赖包是从官方网站https://pypi.python.org/simple/来进行下载,但是由于该网站连接相当慢(你懂得),所以我们可以选择修改下载源。通常可以选择豆瓣的源pypi.douban.com/simple
1)windows下源的选择配置
当我们用python setup.py install 进行安装的时候,默认的是采用的官方的源,如果想要改的话,可以修改里面的配置文件setup.cfg,在里面添加这么两行:
[easy_install]
index_url = http://pypi.douban.com/simple
这样的话,就可以了。
修改了setup.cfg之后,以后配置就可以随着源码走了。
2)linux下源的选择配置
如果使用的是pip安装,那么就可以修改~/.pip/pip.conf
~/.pip/pip.conf
1
2
[global]
index-url = http://pypi.douban.com/simple
但是如果是使用setup.py安装的话,还需要修改distutils的配置。可以通过~/.pydistutils.cfg来配置distutils的源。如下:
~/.pydistutils.cfg
1
2
[easy_install]
index_url = http://pypi.douban.com/simple
然后就可以在setup.py安装依赖的时候使用豆瓣源了。
这样的话,就可以快速的下载了。
scrapy的安装
1)windows下的安装
windows的安装主要参考http://www.phpno.com/scrapy-install.html 中的安装方法。(但是其中也有些稍微的改动,最主要的不同在于所选择的源的不同。)
1、python的安装
可以从网络中获取python的安装包来进行安装。或者通过官网进行下载http://www.python.org/ftp/python/2.7.5/python-2.7.5.msi
我选择的是python2.7。然后就需要将python的路径加入环境变量:一个是python的安装路径(D:\Python27),另外一个是(D:\Python27\Scripts),我们最后安装成功的scrapy最后就是在scripts里面。
2、安装setuptools.
官网下载setuptools(http://pypi.python.org/pypi/setuptools)& 傻瓜安装
3、安装Zope.Interface
官网下载Zope.Interface(http://pypi.python.org/pypi/zope.interface/)& 傻瓜安装
验证是否安装ok
1
2
3
4
5
6
C:\Users\admin>python
Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win
32
Type "help", "copyright", "credits" or "license" for more information.
>>> import zope.interface
>>>
4、安装Twisted
官网下载Twisted(http://twistedmatrix.com/trac/wiki/Downloads)& 傻瓜安装
5、安装w3lib
官网下载w3lib(http://pypi.python.org/pypi/w3lib)安装
1
2
#进入插件目录并执行命令安装
>D:\python-plugin\w3lib-1.3>python setup.py install
验证
1
2
3
4
5
6
D:\python-plugin\w3lib-1.3>python
Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win
32
Type "help", "copyright", "credits" or "license" for more information.
>>> import w3lib
>>>
6、安装libxml2
官网下载libxml2(http://users.skynet.be/sbi/libxml-python/)& 傻瓜安装
7、安装pyOpenSSL
官网下载pyOpenSSL(https://pypi.python.org/pypi/pyOpenSSL)& 傻瓜安装
pyopenssl 现在改成需要setup.py来进行安装,但是它的正确安装需要首先安装cryptography。安装cryptography需要已经正确的安装了openssl,并且需要正确的设置了头文件和库文件
set LIB=C:\OpenSSL-win32\lib;%LIB%
set INCLUDE=C:\OpenSSL-win32\include;%INCLUDE%
python setup.py cryptography
这样,正确的安装了cryptography之后,才可以安装pyopenssl
8、安装scrapy
官网下载scrapy(https://pypi.python.org/pypi/Scrapy)
安装
1
2
#进入scrapy目录并执行安装
>D:\python-plugin\Scrapy-0.16.5>python setup.py install
验证
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
D:\python-plugin\Scrapy-0.16.5>scrapy
Scrapy 0.16.5 - no active project
Usage:
scrapy <command> [options] [args]
Available commands:
fetch Fetch a URL using the Scrapy downloader
runspider Run a self-contained spider (without creating a project)
settings Get settings values
shell Interactive scraping console
startproject Create new project
version Print Scrapy version
view Open URL in browser, as seen by Scrapy
[ more ] More commands available when run from project directory
Use "scrapy <command> -h" to see more info about a command
D:\python-plugin\Scrapy-0.16.5>
安装完毕 OK
2) linux下的安装
下载最新scrapy, 进去python setup.py install, 如果pypi通畅的话就一直下来,如果卡在哪个包上就手动下载安装。依赖的包很不少呢,比如Twisted, cryptography-0.2.2, zope.interface-4.1.0.tar.gz等,在这个过程中会有编译不过的一些包,主要原因是还有几个devel的库没有install, 确保install了下边这些库就行了:
easy_install Cython
yum install libxslt-devel libxml2-devel libffi-devel openssl-devel
验证:scrapystartproject tutorial不出错就OK啦~
- scrapy安装方法(windows以及linux)
- Scrapy安装(For windows 不过Linux也是相通的)
- Python Scrapy安装方法(windows平台)
- Windows下安装scrapy(python3.6)
- Phantomjs安装(Windows以及Linux环境)
- windows下安装scrapy
- windows安装scrapy
- Windows下安装Scrapy
- windows下 scrapy 安装
- windows下安装Scrapy
- [Scrapy]Windows平台安装
- Windows下安装scrapy
- Windows下Scrapy安装
- windows下scrapy安装
- windows 安装scrapy
- windows如何安装scrapy
- windows安装Scrapy
- Windows下安装Scrapy
- POJ 3414
- myeclipse中格式化代码快捷键的问题解决方案和<url-pattern>的用法
- POJ 3450 Corporate Identity(KMP:最长连续公共子序列)
- 抱歉
- VS的常用快捷键如下:
- scrapy安装方法(windows以及linux)
- duilib : write text on richedit
- {A} + {B}
- POJ 2965:The Pilots Brothers' refrigerator:棋盘题目2
- Linux环境进程间通信——消息队列
- 有很大的关系的网站关键词的排名和网站内容
- Tkprof
- 经典换路前后的电路计算
- 谓词