抓取网页的两种方式.可直接使用
来源:互联网 发布:corelpainter for mac 编辑:程序博客网 时间:2024/06/06 17:24
1: CloseableHttpClient
/* * 爬取网页信息 */private static String pickData(String url) {CloseableHttpClient httpclient = HttpClients.createDefault();try {HttpGet httpget = new HttpGet(url);CloseableHttpResponse response = httpclient.execute(httpget);try {// 获取响应实体HttpEntity entity = response.getEntity();// 打印响应状态if (entity != null) {return EntityUtils.toString(entity);}} finally {response.close();}} catch (ClientProtocolException e) {e.printStackTrace();} catch (ParseException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();} finally {// 关闭连接,释放资源try {httpclient.close();} catch (IOException e) {e.printStackTrace();}}return null;}
/* * 爬取网页信息 */public static String sendGet(String url) throws Exception {String result = "";URLConnection conn = null;InputStream inputStream = null;BufferedReader in = null;URL realURL = new URL(url);conn = realURL.openConnection();conn.setRequestProperty("accept", "*/*");conn.setRequestProperty("connection", "Keep-Alive");conn.setRequestProperty("user-agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36");Map<String, List<String>> map = conn.getHeaderFields();for (String s : map.keySet()) {System.out.println(s + "-->" + map.get(s));}inputStream = conn.getInputStream();String line;// 读取操作in = new BufferedReader(new InputStreamReader(inputStream, "utf-8"));while ((line = in.readLine()) != null) {result += "\n" + line;}in.close();System.out.println(result);return result;}
阅读全文
0 0
- 抓取网页的两种方式.可直接使用
- Javascript加入网页的两种方法:直接方式和引用方式
- 【PHP-网页内容抓取】抓取网页内容的两种常用方法
- 网页抓取三种方式
- PHPSpider使用记录-post方式抓取网页
- android 打开网页的两种方式.
- python登录网页的两种方式
- 网页底部固定的两种方式
- Android访问网页的两种方式
- 网页分页数据的三种抓取方式亲测
- 网页分页数据抓取的几种方式
- 用file_get_contents抓取网页乱码的2种解决方式
- 网页分页数据的三种抓取方式亲测
- 用file_get_contents抓取网页乱码的2种解决方式
- 关于直接写SQL语句和使用Parameter参数两种方式的迷惑
- php抓取网页的若干实现方式
- 直接插入排序的两种实现方式
- Flume直接到SparkStreaming的两种方式
- 2017年全国大学生电子设计竞赛河北省获奖名单
- javascript中的ArrayList(咋个办呢 zgbn)
- php扩展开发---回调php方法-call_user_function
- 2017.11.8机房小测-题目性质/区间计数(杂题)/DP状态巧定义
- Kotlin优点总结
- 抓取网页的两种方式.可直接使用
- 豆瓣的基础架构
- java图形化用户界面 作业1
- 关于安装多版本jdk,打开eclipse时,提示could not find java se runtime environment的解决banf
- web工程前后台换行符传递与转义
- PAT考试乙级1026(C语言实现)
- 新手向:Vue 2.0 的建议学习顺序
- 关于Android Studio无法查看详细的源代码问题解决
- 安卓Canvas 画图清除之前的轨迹问题