java爬取人人网数据
来源:互联网 发布:播放器用不了网络 编辑:程序博客网 时间:2024/05/17 08:15
通过httpclient何httpparser两个类爬人人网中得数据,其中的详细步骤以及文档下面详细介绍。
/*
* 爬人人网相关代码
*
*/
@SuppressWarnings("deprecation")
public class RenRen {
//输入用户名及密码
@SuppressWarnings("unused")
private static String userName = "";
@SuppressWarnings("unused")
private static String passWord = "";
//设置爬虫网址
private static String renRenLoginURL = "http://www.renren.com/PLogin.do";
private HttpResponse response;
//创建HttpClient对象
@SuppressWarnings({ })
private DefaultHttpClient httpclient = new DefaultHttpClient();
//输入抓包的参数,及传递的参数
private boolean login(){
HttpPost httpPost = new HttpPost(renRenLoginURL);
//建立一个namevaluepair数组,用于存储传送相关参数
List<NameValuePair> nvps = new ArrayList<NameValuePair>();
nvps.add(new BasicNameValuePair("domain", "renren.com"));
nvps.add(new BasicNameValuePair("isplogin", "true"));
nvps.add(new BasicNameValuePair("submit", "登陆"));
nvps.add(new BasicNameValuePair("email", "userName"));
nvps.add(new BasicNameValuePair("password", "password"));
try {
//登陆成功,获取返回的数据,及html文件
httpPost.setEntity(new UrlEncodedFormEntity(nvps,HTTP.UTF_8));
response = httpclient.execute(httpPost);
} catch (Exception e) {
e.printStackTrace();
return false;
}finally {
httpPost.abort();
}
return true;
}
//获取响应头
private String getRedirectLocation(){
Header locationHeader = response.getFirstHeader("Location");
if (locationHeader == null) {
return null;
}
return locationHeader.getValue();
}
//获取html文本
private String gettext(String redirectLocation){
HttpGet httpget = new HttpGet(redirectLocation);
ResponseHandler<String> responseHandler = new BasicResponseHandler();
String responseBody = "";
try{
responseBody = httpclient.execute(httpget,responseHandler);
}catch(Exception e){
e.printStackTrace();
responseBody = null;
}finally{
httpget.abort();
httpclient.getConnectionManager().shutdown();
}
return responseBody;
}
//如果注册成功了,输入响应的html
public void printText(){
if (login()) {
String redirectLocation = getRedirectLocation();
if (redirectLocation != null) {
System.out.println(gettext(redirectLocation));
}
}
}
//主函数main方法
public static void main(String[] args){
RenRen renRen = new RenRen();
renRen.printText();
}
}
- java爬取人人网数据
- 利用python爬取人人贷网的数据
- 爬取人人贷
- python实现人人网用户数据爬取及简单分析
- Python爬虫:爬取人人都是产品经理的数据
- HttpClient模拟登陆人人网,并且爬取日志内容(一)
- Python实现人人网爬虫,爬取用户所有状态信息。
- python 爬虫爬取人人网你的好友的所有相册图片
- 人人取反
- java Jsoup 爬取网页数据
- 人人code,整数取反
- 人人code,整数取反
- 人人code, 整数取反。
- 人人code,整数取反
- 拉取人人直播流
- 人人网JAVA笔试题解答
- 人人网JAVA笔试题解答
- HTTPClient实现java自动登录人人网
- chrome javascript程序拓展(自动订餐插件)
- 网易的一道面试题
- JAVA 你读得懂的语言!
- 顺序输出
- 进程与线程
- java爬取人人网数据
- android从放弃到坚持放弃第一课
- GUI keylistener事件
- 算法第五周——贪心算法
- Js`HTML_校验文本框设置[span颜色字体等]
- 找点
- 【java】transient关键字
- swift 和oc的部分小区别
- Hibernate中一级缓存、二级缓存及查询缓存的总结