Java中伪造referer来获取数据

来源:互联网 发布:鸡啄米 mfc编程入门 编辑:程序博客网 时间:2024/05/01 08:40

很多网站的防采集的办法,就是判断浏览器来源referer和cookie以及userAgent,道高一尺魔高一丈.

在Java中获取一个网站的HTML内容可以通过HttpURLConnection来获取.我们在HttpURLConnection中可以设置referer来伪造referer,轻松绕过这类防采集的网站

view sourceprint?
1HttpURLConnection conn = (HttpURLConnection) new URL(path).openConnection();
2conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon;)");
3conn.setRequestProperty("Accept-Encoding", "gzip");
4conn.setRequestProperty("referer", "http://www.popo4j.com");
5conn.setRequestProperty("cookie", "http://www.popo4j.com");
6InputStream inputStream = conn.getInputStream();
7//保存inputstream中的东西就OK了
0 0
原创粉丝点击