php 爬虫如何爬取ajax异步加载文件
来源:互联网 发布:百度网盘总是网络异常 编辑:程序博客网 时间:2024/06/01 07:34
最近做爬虫,遇到了需要爬取异步文件中的内容,结果找不到方法,耽搁了好久,最后终于找到啦,使用phantomjs
直接下载phantomjs,然后可以直接使用啦
贴出codes.js
//codes.js system = require('system') address = system.args[1];//获得命令行第二个参数 接下来会用到 var page = require('webpage').create(); var url = address; page.settings = { loadImages: false, //禁止加载图片 resourceTimeout = 10000, userAgent: 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.31 (KHTML, like Gecko) PhantomJS/19.0' }; page.open(url, function (status) { if (status !== 'success') { //console.log('Unable to post!'); } else { console.log(page.evaluate(function(){ var c = document.querySelector('#pgrow').innerHTML; //获取HTML中pgrow标签内的内容 return c; })); } phantom.exit(); });
php部分:
<?php$command = "F:/PHP/workspace/Test1/phantomjs.exe F:/PHP/workspace/Test1/codes.js $url 2>&1"; $page =exec($command,$output); //执行结果但不输出 //$page = passthru($command); //直接输出整个内容 var_dump($output);?>
这样就可以获取到啦,接下来你就可以随心所欲了。希望对大家有帮助!
0 0
- php 爬虫如何爬取ajax异步加载文件
- ajax异步加载网页爬虫
- scrapy-splash 爬虫渲染异步加载,ajax
- 爬虫爬取ajax内容
- python爬虫爬取简单的动态数据-异步加载问题
- python爬虫之异步XHR爬取
- ThinkCMF中如何实现ajax异步加载
- PHP+AJAX实现文件异步上传(一)
- js+php ajax异步上传文件
- PHP爬虫 爬取污染数据实例
- php 爬虫 爬取12306接口
- 【Python爬虫】利用Selenium等待Ajax加载及模拟自动翻页,爬取东方财富网公司公告
- Python爬虫:如何爬取分页数据?
- 如何调试异步加载的js文件
- 如何调试异步加载的js文件
- 如何调试异步加载的js文件
- jQuery:$post、$get、$ajax与php,实现异步加载
- jQuery:$post、$get、$ajax与php,实现异步加载
- vi快捷键必知必会
- FMDB基本使用
- 左旋转字符串
- 【Hdu 5661】 Claris and XOR 位运算+贪心
- studyjams notes 1B-- relative layout + padding & margin
- php 爬虫如何爬取ajax异步加载文件
- iOS学习笔记02-UIScrollView
- 深度学习卷积神经网络大事件一览
- iOS学习笔记03-UITableView
- 87 智能指针(一)
- 搜索 第一题 二分问题
- 2006: [NOI2010]超级钢琴 ST表+优先队列
- 搜索专题 第二个·
- BestCoder Round #79 (div.2) hdu 5660 ,hdu 5661