java读取URL的内容
来源:互联网 发布:中控iface702软件 编辑:程序博客网 时间:2024/06/16 22:35
给定一个链接,返回里面的html代码,
1、可以用于在项目中抓取返回的某些字段
2、类似爬虫,抓取自己想要的信息
import java.io.BufferedReader;import java.io.InputStreamReader;import java.net.URL;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;public class LoadUrl { public static void main(String[] args) throws Exception { //这里要注意,因为是http请求,所以要加行http://,不然会报错: //Http协议异常:java.net.MalformedURLException: no protocol: www.baidu.com System.out.println(readUrl(" http://www.baidu.com")); } /** * 读取url的内容 * @param url * @return * @throws Exception */ public static String readUrl(String url) throws Exception{ BufferedReader br = new BufferedReader(new InputStreamReader(new URL(url).openConnection().getInputStream(),"GB2312")); StringBuffer str = new StringBuffer(); String realLineStr = null; while((realLineStr = br.readLine()) != null){ str.append(realLineStr).append("\r\n"); //每读取一行就换行 } return str.toString(); }}
也可以直接使用Jsoup来读取:
Document doc = Jsoup.connect("http://www.baidu.com").get();
阅读全文
0 0
- java读取URL的内容
- java读取URL指定的网页内容
- java 使用URL来读取网页内容
- 读取指定URL连接的文件内容
- 使用URL读取网页的内容
- python 读取url内容
- 读取url网页内容
- Java 获取URL的内容
- java 根据 url 读取网页内容 遇到403问题
- 通过对应 的URL地址,读取页面里面的内容
- 通过URL读取文件内容
- 使用URL读取网页内容
- PHP fopen读取url内容
- c# 通过url读取某网站下文件的内容
- 利用 HDFS 的 URL 方式读取 HDFS 内文件内容
- php使用Url读取文件的内容及file_get_contents用法
- URL类:使用URL读取网页内容
- java-抓取指定URL网页的内容
- HTML5数据库查询
- web.xml文件详解
- poj 2253 Frogger 最小生成树
- 关于CSS常用的基础知识
- [置顶] Postman插件下载安装与使用教程
- java读取URL的内容
- 验证(C#和正则表达式)
- 对DataFrame列名进行更改的两种方式
- 计算机网络读书笔记——数据链路层(5)
- linux的权限复习
- 258. Add Digits
- 异常的规则
- PAT--1068. Find More Coins
- C++任务队列与多线程