网络编程——URL读取网页数据
来源:互联网 发布:广州海关数据分中心 编辑:程序博客网 时间:2024/05/16 01:34
本文实现抓取链接网页内容:【http://blog.csdn.net/weixin_36146275/article/details/54605784】此链接是博主的博客,用来做个例子。
import java.io.IOException;import java.io.InputStream;import java.net.MalformedURLException;import java.net.URL;import java.net.URLConnection;import java.util.Scanner;public class URLConn {/** * 获取网页链接中的所有内容 * @return */public static String getContentFromUrl(){String content = "";try {//传入网页访问地址String address = "http://blog.csdn.net/weixin_36146275/article/details/54605784";URL url = new URL(address);URLConnection conn = url.openConnection();//添加一行,解决"403服务器拒绝访问"错误conn.setRequestProperty("User-Agent", "Mozilla/31.0 (compatible; MSIE 10.0; Windows NT; DigExt)");//获取网页输入流InputStream is = conn.getInputStream();//设置流的编码格式Scanner s = new Scanner(is , "UTF-8");//一行一行拼接流信息while(s.hasNextLine()){content += s.nextLine()+"\n";}//关闭Scanner、InputStreams.close();is.close();} catch (MalformedURLException e) {e.printStackTrace();} catch (IOException e) {e.printStackTrace();}return content;}/** * 计算截取网页内容起始位置,并截取。 * @param content * @return */public static String getSPFromContent(String content){String sp = "";//开始位置int beginIdex = content.indexOf("<div id=\"article_details\" class=\"details\">");//结束位置int endIndex = content.indexOf("<div id=\"suggest\"");sp = content.substring(beginIdex, endIndex);return sp;}public static void main(String[] args) {String content = getContentFromUrl();String sp = getSPFromContent(content);System.out.println(sp);}}
使用html编辑工具打开就看到正常的网页了
1 0
- 网络编程——URL读取网页数据
- [网络编程]——URL
- Android 网络编程之HttpURLConnection(conn.getResponseCode() != 200,从url读取写入数据)
- Java网络编程——URL
- 读取url网页内容
- android 网络编程--URL获取数据/图片
- Java 网络 URL 从网页上获取数据
- JAVA 网络 URL 从网页上获取数据 二
- 浅谈IOS网络编程怎样读取数据
- iOS网络编程-URL网络数据的解析
- 使用URL读取网页内容
- URL类:使用URL读取网页内容
- JAVA网络编程——InetAddress、InetSocketAddress和URL
- Android 网络编程(2)——URL互联网资源指针
- JAVA网络编程之——URL类
- Java网络编程——InetAddress类和URL类
- C# 网络编程之webBrowser获取网页url和下载网页中图片
- iOS 网络编程 (1)-解析URL,提取数据
- ARM LR寄存器
- Axis2 WebService客户端的三种方式
- perl内置函数原型
- 需求分析
- Axis2方式发布webService的三种方式
- 网络编程——URL读取网页数据
- 实验
- 神经网络深入(连载1)神经网络的拓扑
- Leetcode 9. Palindrome Number
- 数学预习题目分析
- 编程珠玑: 13章 搜索 13.4使用整数结构,生成[0 ,maxval]范围内m各随机整数的有序序列 -------解题总结
- Axis2与Spring集成发布
- eclipse_快捷键
- Git 使用规范流程