htmlunit使用代理IP
来源:互联网 发布:软件安装管理器 知乎 编辑:程序博客网 时间:2024/05/16 05:10
有时候频繁的爬取第三方站点内容,会被站点的防火墙拦截,IP拉黑,所以这时候,就要用到代理IP,拉黑一个就换一个
htmlunit实用代理的方式比较简单,WebClient重载构造方法就有提供
package com.gcx.htmlunit;import java.io.IOException;import java.net.MalformedURLException;import com.gargoylesoftware.htmlunit.BrowserVersion;import com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException;import com.gargoylesoftware.htmlunit.WebClient;import com.gargoylesoftware.htmlunit.html.DomElement;import com.gargoylesoftware.htmlunit.html.DomNodeList;import com.gargoylesoftware.htmlunit.html.HtmlDivision;import com.gargoylesoftware.htmlunit.html.HtmlListItem;import com.gargoylesoftware.htmlunit.html.HtmlPage;public class IpSearch {public static void main(String[] args) {//实例化web客户端 模拟指定浏览器WebClient wc=new WebClient(BrowserVersion.FIREFOX_52,"60.2.148.253",80);try {//解析获取页面HtmlPage page = wc.getPage("https://www.baidu.com");//获取htmlSystem.out.println("网页:"+page.asXml());} catch (FailingHttpStatusCodeException e) {e.printStackTrace();} catch (MalformedURLException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();wc.close();//关闭客户端,释放资源}}}
运行效果和前面一样,只是速度会慢点 毕竟用了代理
阅读全文
0 0
- htmlunit使用代理IP
- htmlunit使用代理IP
- htmlunit使用
- htmlUnit使用
- 怎样使用IP代理
- httpclient使用代理ip
- HttpClient使用代理IP
- HttpClient使用代理ip
- CURL使用代理IP
- HttpClient使用代理IP
- HttpClient使用代理IP
- HtmlUnit使用体会
- 使用Htmlunit上传文件
- htmlunit爬虫工具使用
- htmlunit使用实例
- HtmlUnit初步使用心得
- 使用HtmlUnit登录百度
- htmlUnit的使用
- 检测手机最多可以几个点触摸
- plsql连接本地oracle和远程oracle
- 多重背包问题的三种复杂度解法,O(n * w * c)、O(n*w*log c)和O(n * w)。
- C# webBrowser写模拟器时的javascript脚本调用问题
- 欧拉通路
- htmlunit使用代理IP
- 后缀数组
- mybatis框架及原理
- CentOS7 安装 vsftpd 完整版
- (三)简单工厂模式详解
- ARM指令中如何判断一个立即数是有效立即数
- [7.9] 纪中C组
- OpenCV3 Python语言实现 笔记1
- GalaxyOJ-687 (离散化)