java爬取任何指定网页得数据

来源:互联网 发布:linux 文件上传 编辑:程序博客网 时间:2024/05/28 18:43

通过java中的.net包抓取网页上的数据,并且自动生成文件,详细代码如下:


import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.nio.charset.Charset;


public class test {


public static void main(String[] args) throws IOException{
String charset = "utf-8";
URL url = new URL("http://www.sina.com.cn/");
BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream(),charset));
BufferedWriter write = new BufferedWriter(new FileWriter("data.html"));
String line;
while ((line = reader.readLine()) != null) {
System.out.println(line);
write.write(line);
write.newLine();
}
reader.close();
write.close();
}
}

0 0
原创粉丝点击