爬虫学习笔记--Selenium PhantomJS
来源:互联网 发布:snmp trap 端口号 编辑:程序博客网 时间:2024/05/18 00:25
import osimport threadingimport refrom bs4 import BeautifulSoupfrom urllib.request import urlopenfrom selenium import webdriverbrowserPath = '/opt/phantomjs-2.1.1-linux-x86_64/bin/phantomjs' #你phantomjs的安装目录homePage = 'https://mm.taobao.com/search_tstar_model.htm?'#目标地址outputDir = 'photo/'parser = 'html5lib'driver = webdriver.PhantomJS(executable_path=browserPath)driver.get(homePage)bsObj = BeautifulSoup(driver.page_source,parser)girlsList = driver.find_element_by_id('J_GirlsList').text.split('\n')print (driver.find_element_by_id('J_GirlsList').text.split('\n'))
给一个 phantomjs的下载地址
https://npm.taobao.org/mirrors/phantomjs
阅读全文
0 0
- 爬虫学习笔记--Selenium PhantomJS
- 爬虫利器:Selenium+PhantomJS
- phantomjs+selenium+python爬虫
- 爬虫-08-selenium & phantomjs
- Scrapy+PhantomJS+Selenium动态爬虫
- Scrapy+PhantomJS+Selenium动态爬虫
- Scrapy+PhantomJS+Selenium动态爬虫
- Selenium+Chrome(PhantomJs) Python爬虫
- python selenium phantomjs学习
- [笔记] PhantomJS爬虫小记
- 爬虫学习-phantomjs
- <41>python学习笔记——selenium / phantomjs
- [python爬虫]selenium+PhantomJS模拟登陆
- Python爬虫利器Selenium+PhantomJS系列入门
- 从零开始学网络爬虫之selenium/phantomjs
- Python爬虫之Selenium+PhantomJS组合
- selenium phantomjs 实现新浪微博爬虫
- selenium+python+phantomjs爬虫博客排行榜
- 欢迎使用CSDN-markdown编辑器
- Cloud郵便番号API
- linux命令之rpm
- php栈和队列
- hdu 6005 Pandaland(dij+暴力)
- 爬虫学习笔记--Selenium PhantomJS
- json介绍
- Flume安装及简单部署
- Springboot打成war包并在tomcat中运行
- hihocoder#1410 : Powers of Two(水题)
- 浅谈vue 动态加载、注册组件
- Lucas–Kanade光流算法
- py2neo——Neo4j&python的配合使用
- mini-caffe编译,用BLVC caffe编译的mnist模型进行测试