[Python]Selenium的安装

来源:互联网 发布:mac 获取当前路径 编辑:程序博客网 时间:2024/06/06 19:45

[Python]Selenium的安装

  • Selenium简介

Selenium,自动化测试工具。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器,如果在这些浏览器里面安装一个 Selenium 的插件,便可以方便地实现Web界面的测试。换句话说,Selenium 支持这些浏览器驱动。

现在很多虫师为了绕过反爬虫的机制,都选择Selenium。由于Selenium的原理是唤起浏览器操作,因而代价就是爬虫非常慢。

本文参考内容来自
Selenium官网、Selenium Python文档

  • Selenium安装

环境:ubuntu14.04, python2.7

直接pip安装:sudo pip install selenium

或者离线包安装:https://pypi.python.org/pypi/selenium#downloads
解压之后,在安装目录(cd selenium-3.4.2)下执行:

sudo python setup.py install

这里写图片描述

安装成功后,查看版本:

$ python>>> import selenium>>> print selenium.__version__

这里写图片描述

  • Selenium简单测试
from selenium import webdriver# driver = webdriver.Chrome()driver = webdriver.Firefox()driver.get('http://www.baidu.com')print driver.title# driver.quit()

运行这段代码,会自动打开浏览器,然后访问百度。

运行时在driver = webdriver.Firefox()处报错:
selenium.common.exceptions.WebDriverException: Message: ‘geckodriver’ executable needs to be in PATH.
这里使用webdriver.Chrome()或者webdriver.Firefox()都报一样的错。

如果程序执行出现上述错误,浏览器没有打开,那么应该是没有装Firefox浏览器或者 Firefox驱动没有配置在环境变量里。下载驱动,然后将驱动文件路径配置在环境变量即可。

  • 安装Driver驱动器

chromedriver(Chrome浏览器):http://chromedriver.storage.googleapis.com/index.html

geckodriver(Firefox浏览器):https://github.com/mozilla/geckodriver/releases

安装的方法:http://stackoverflow.com/questions/8255929/running-webdriver-chrome-with-selenium

这里写图片描述

简单的说,就是下载解压后,放到/usr/bin,然后加上执行权限

chromedriver 操作如下:

$ unzip chromedriver_linux64.zip$ sudo mv chromedriver /usr/bin/$ cd /usr/bin/$ sudo chmod +x chromedriver

geckodriver 操作如下:

$ tar -xzvf geckodriver-v0.16.1-linux64.tar.gz$ sudo mv geckodriver /usr/bin/$ cd /usr/bin/$ sudo chmod +x geckodriver

更新浏览器:

$ sudo apt-get update$ sudo apt-get install firefox
  • 再运行代码

测试成功~

Chrome

Firefox

PS:经测试,感觉用Chrome浏览器比Firefox要快一点~

参考:ubuntu14.04学习selenium之一:安装