java 采集 AJAX页面
来源:互联网 发布:mysql和oracle的分页 编辑:程序博客网 时间:2024/05/16 14:27
package com;
/**
* <p>Title: </p>
*
* <p>Description: </p>
*
* <p>Copyright: Copyright (c) 2012</p>
*
* <p>Company: </p>
*
* @author not attributable
* @version 1.0
*/
import java.net.URL;
import java.math.BigDecimal;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Iterator;
import java.util.List;
import java.util.Map;
import java.util.Set;
import com.gargoylesoftware.htmlunit.BrowserVersion;
import com.gargoylesoftware.htmlunit.CollectingAlertHandler;
import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.DomNodeList;
import com.gargoylesoftware.htmlunit.html.HtmlDivision;
import com.gargoylesoftware.htmlunit.html.HtmlElement;
import com.gargoylesoftware.htmlunit.html.HtmlForm;
import com.gargoylesoftware.htmlunit.html.HtmlPage;
import com.gargoylesoftware.htmlunit.html.HtmlPasswordInput;
import com.gargoylesoftware.htmlunit.html.HtmlSubmitInput;
import com.gargoylesoftware.htmlunit.html.HtmlTable;
import com.gargoylesoftware.htmlunit.html.HtmlTableCell;
import com.gargoylesoftware.htmlunit.html.HtmlTableRow;
import com.gargoylesoftware.htmlunit.html.HtmlTextInput;
import com.gargoylesoftware.htmlunit.NicelyResynchronizingAjaxController;
public class test {
public static void main(String[] argv) {
getHomeTile();
}
public static void getHomeTile(){
try {
final URL url = new URL("http://test.com");
final WebClient webClient = new WebClient(BrowserVersion.FIREFOX_3_6); // tried also FIREFOX_3
webClient.setAjaxController(new NicelyResynchronizingAjaxController());
final HtmlPage page = webClient.getPage(url);
webClient.waitForBackgroundJavaScript(10000);
System.out.println(page.getElementById("a-table-tr").asXml());} catch(Exception ex) {
}
}}
其中用到了一个htmlunit模拟浏览器
- java 采集 AJAX页面
- C#对Ajax页面内容采集
- 采集页面的图片PHP+js+ajax
- 火车头采集器 采集Ajax页面 一页自动刷新列表的 网站 xpath 标签
- java调用phantomjs采集ajax加载生成的网页
- java调用phantomjs采集ajax加载生成的网页
- Java调用phantomjs采集ajax加载生成的网页
- Java数据采集-7.Ajax无刷新请求(翻页-3)
- 开源 java CMS - FreeCMS2.3 Web页面信息采集
- 页面信息采集
- .net 页面防采集
- 使用phantomjs+java 爬取AJAX页面
- 火车头采集器 题解页面信息采集 过滤采集内容
- curl 采集ssl证书页面
- file_get_contents进行页面采集数据
- 怎么同时采集两个页面??
- 1 采集单个列表页面
- 好以前写的一个java采集淘宝搜索页面商品数据的函数
- FastDFS配置说明
- 【MongoDB for Java】Java操作MongoDB
- 自动化发布:js和css文件的压缩
- PHP中,如果想使用静态调用函数又不想把类的方法写成静态
- 解决VS2010 command prompt error:nmake 不是内部或外部命令,也不是可运行的程序或批处理文件
- java 采集 AJAX页面
- 改变一个apk的packagename的简单流程,就2个步骤
- session和cookie在失效
- eclipse生成jar包
- 使用spring注解,注入sessionFactory类
- 用Eclipse的SVN管理Android的问题
- 想在自己的android应用中获得当天的天气情况,这该怎么做呢?不用担心。中国国家气象局提供了获取所在城市天气预报信息接口。通过这个接口,我们就可以获取天气信息了。
- Android 权限
- ASIHTTPRequest开源类项目导入问题及解决方法