Python 爬虫 —— 获取js渲染的内容

来源：互联网发布：百度文库知乎编辑：程序博客网时间：2024/05/16 06:35

在访问某网站时发现在HTML源码中看不到所需的数据：

网页内容：

HTML源码内容：

于是，我们想到了一个最简单的方法——用 Selenium + PhantomJS 来实现模拟浏览从而获取想要的内容。

下面是示例代码：

from selenium import webdriverbrowser = webdriver.PhantomJS(executable_path = './phantomjs')browser.get("http://www.site-digger.com/html/articles/20110516/proxieslist.html")trs = browser.find_elements_by_tag_name('tr')for tr in trs[1:]:    print(tr.text.split(' ')[0])

我们可以看到：

阅读全文

0 0

Python 爬虫 —— 获取js渲染的内容
python 爬虫如何获取js里面的内容
python爬虫——获取正文内容
Python爬虫：Selenium+ BeautifulSoup 爬取JS渲染的动态内容（雪球网新闻）
Python 网络爬虫与信息获取（二）—— 页面内容提取
Python爬虫_获取贴吧内容
Python爬虫如何获取动态内容-上
Python爬虫如何获取动态内容-下
Python爬虫——实战三：爬取苏宁易购的商品价格(渲染引擎方法)
Python爬虫—破解JS加密的Cookie
Python 网络爬虫与信息获取（一）—— requests 库的网络爬虫
python爬虫——获取新闻标题
python爬虫——获取图片2
Python 爬虫 PhantomJs 获取JS动态数据
Python 爬虫 PhantomJs 获取JS动态数据
java网络爬虫——获取页面的所有超链接的内容
pyhton爬虫（8）——获取网易新闻内容
Python分布式爬虫前菜(1):关于静态动态网页内容获取的N种方法
Java 类——构造方法
greenDAO文档翻译一：如何开始
centos7安装mysql5.7.18
构建一个完备的问答系统需要做的事情
Java String对象具有只读性
Python 爬虫 —— 获取js渲染的内容
【随记】在idea下使用jUnit4
MBProgressHUD在oc、swift项目中的封装使用
关于sort的比较函数的static 声明
单片机时钟程序（1）main.c
在地球上，已知A点的经纬度和B点的经纬度，算出AB点之间的距离
链表求和II
Java IO-常用流总结
CSS 继承性