CentOS7安装Scrapy和一些爬虫会用到的服务
来源:互联网 发布:淘宝聘用店主 编辑:程序博客网 时间:2024/05/16 07:44
- 博客链接 https://uublog.com/article/20170308/centos7-install-scrapy/
讯云这几天搞活动,免费领了三个月的免费VPS。所以想把本地虚拟机的scrapy爬虫迁移上去。
Scrapy是基于Python写的。本来是要安装Python的,但是现在Linux基本都默认安装到Python了,所以这步略过。
我本地是Ubuntu,服务器我装了CentOS7.2。别问我为啥不用Debian,我瞎选的,没啥特别理由。
自己私人使用,为了方便,直接是root开干。
- 安装pip包管理
yum install -y python-pip
- 配置pip安装源为阿里云 http://mirrors.aliyun.com/help/pypi。
我觉得这是天朝必备的一个步骤,否则安装软件那龟速不忍直视。
mkdir ~/.pipvim ~/.pip/pip.conf# 改为如下内容[global]index-url = http://mirrors.aliyun.com/pypi/simple/[install]trusted-host=mirrors.aliyun.com
3, 安装编译器和开发库之类的,假如你们也没安装的话
yum -y install gcc gcc-c++ kernel-devel python-devel libxslt-devel libffi-devel openssl-devel
- 安装主角
Scrapy
pip install scrapy
- 安装
MySQL-python
Python连接MySQL的模块
easy_install MySQL-python
如果遇到mysql_config not found
之前的博文有提过这个错误,不过是在Ubuntu下的解决方案-安装libmysqlclient-dev
然而在CentOS的源中并没有这个包。而安装mysql-devel
即可。
yum install -y mysql-devel
- 安装
MySQL
数据库yum groupinstall mariadb mariadb-client
MariaDB其实可以看做MySQL新版吧,具体缘由自行百度。
- 安装
redis
NoSQL数据库
会用到配合bloomfilter做url去重。
yum install -y redis
- 安装
BloomFilter
模块
pip install bloomfilter
至此就差不多了,目前我就用到这些,另外requests和beautifulsoup4模块也装一下。
阅读全文
1 0
- CentOS7安装Scrapy和一些爬虫会用到的服务
- python爬虫 - scrapy的安装和使用
- scrapy用到的一些配置问题
- Python 爬虫6——Scrapy的安装和使用
- python的爬虫框架scrapy安装和简单使用
- scrapy爬虫整理的一些知识点
- 在centos7和centos6下安装scrapy
- centos7 telnet服务的安装和启动
- Scrapy爬虫入门教程 安装和基本使用
- ACM会用到的一些数学知识
- GDB 会用到的一些操作
- 会用到的一些按钮样式
- 一些编程会用到的小技巧
- css 一些会用到的小技巧
- 一些平时会用到的资料
- Python爬虫Scrapy的安装配置
- 爬虫框架Scrapy的安装与简介
- Python爬虫1-Scrapy环境的安装
- TestNG入门相关网站
- 排序算法之希尔排序的C++实现
- 位置和传感器:运动传感器
- php计算时间差,时间比较,时间计算
- webpack的简单使用实现倒计时
- CentOS7安装Scrapy和一些爬虫会用到的服务
- 加解密
- java实现循环单链表
- 闭包详解
- c# 弹出窗体选择文件代码
- android:screenOrientation属性
- 算法导论 红黑树的扩张 动态顺序统计
- iscsi简介和配置
- 操作符/控制执行流程/初始化与清理