java 网页读取与存储
来源:互联网 发布:模拟人生4捏脸数据 编辑:程序博客网 时间:2024/05/16 08:48
读入 http://www.sina.com.cn 网页的内容,并以可读形式将其输出到一个文件中去
import java.io.*;import java.net.URL;/** * Created by Wu on 2017/4/17. */public class ReadURL { public static void main(String args[]) throws Exception{ URL u = new URL("http://www.sina.com"); InputStream is = u.openStream(); is = new BufferedInputStream(is); Reader r = new InputStreamReader(is,"UTF-8"); FileOutputStream fos = new FileOutputStream("./sina.html"); OutputStreamWriter writer = new OutputStreamWriter(fos,"UTF-8"); int c = 0; while((c = r.read())!=-1){ writer.write(c); } writer.close(); }}
创建一个新浪url的InputStream类 is,再创建一个InputStreamReader r读取 is,此时注意要传入编码参数UTF-8,因为若是使用默认编码参数,会自动使用系统的编码方式。下图可以发现电脑的默认编码方式为GBK。(IntelliJ IDEA在settings->Editor->File Encodings 中查看)
因为网页的编码格式是UTF-8,所以若是不穿参的话会导致网页中文乱码。之后再创建FileOutputStream类和OutputWriter将网页写入文件。运行程序我们可得如下结果
打开此url
并未出现中文乱码
0 0
- java 网页读取与存储
- java存储与读取配置文件
- java 数据处理(int[][]存储与读取)
- Java properties存储与读取遍历
- java读取网页内容
- java读取网页信息
- java读取网页信息
- java读取网页信息
- java 读取网页源码;
- java读取网页信息
- Java 读取网页简易程序
- Java读取网页信息
- Java读取Html网页
- 图片存储与读取
- SharedPreferences存储与读取
- SharedPreferences存储与读取
- 存储与读取变量
- Java读取本地文件和读取指定网页
- Boostrap的form-group和form-control
- c++作业4
- 卡尔曼滤波
- 克隆二叉树
- 中毒的父母
- java 网页读取与存储
- python笔记
- Make Cents? Gym
- SSL 1558——科技庄园
- JavaScript 异常捕获
- JAVA——Scanner类
- CentOS7中systemctl命令详解
- 二维数组的定义(动态初始化、静态初始化)、初始化格式及其操作、java中的参数传递方式,面向对象的基本概念
- php冒泡排序详解笔记