用java将html网页中的文本信息存入txt文件?
来源:互联网 发布:windows清理助手官网 编辑:程序博客网 时间:2024/06/05 11:03
public static String getContent(String strUrl,String fileOutPath,String fileName) {
try {
URL url = new URL(strUrl);
BufferedReader br = new BufferedReader(new InputStreamReader(url.openStream(),"gb2312"));
String s = "";
StringBuffer sb = new StringBuffer("");
while ((s = br.readLine()) != null) {
sb.append(s);
}
br.close();
String tem=sb.toString();
StringBuilder sbu = new StringBuilder("");
int i=1;
int begin;
int end;
do{
begin=tem.indexOf(">",i);
end=tem.indexOf("<",begin);
sbu.append(tem.substring(begin+1, end)+"\r\n");
i=end+1;
}while(i<tem.length()-6);
String outputFile= fileOutPath+fileName+".txt";
FileOutputStream fos=new FileOutputStream(outputFile);
fos.write(sbu.toString().getBytes("gb2312"));
fos.close();
return sbu.toString();
} catch (Exception e) {
return "error open url:" + strUrl;
}
}
在这段程序中若把while(i<tem.length()-6);改为while(i<tem.length());就无法生成txt文件,这是为什么?还有就是这段代码该如何改进?
- 用java将html网页中的文本信息存入txt文件?
- 将TXT文本存入数据库中
- QT中如何实现将textEdit中的内容完全存入txt文本中包括换行
- 将非文本信息存入xml
- 用Unity的TextAsset读取TXT文档内容,将物品信息存入字典中
- 把当前文件中的所有文本拷贝,存入一个txt文件,统计每个字符出现的次数并输出
- MYSQL存储过程在XML文本信息中读取数据节点信息,将节点中的数据存入数据库
- 用c将固定格式的txt文件中的信息读取出来
- 读取txt文件中的文本
- MFC学习之 将 list 表里的信息写入.txt文本 和 .xls EXCEL 文件中
- 使用StreamReader 读取txt文本中的信息
- HtmlParser提取网页中的纯文本信息-java
- 提取HTML中的文本信息
- 提取HTML中的文本信息
- C# 将文本写入txt文件中
- 将java中的System.lut.println()打印语句输出到txt文本中的方法
- 增加将log信息存入/data/中的功能
- HTML 内容抽取并将txt文本放到excel中
- 1、OpenGL ES相关网址
- 阿里与新浪“强强联合”
- .cpio.gz文件解压
- jw player6 配置
- 大话数据模式 建造者模式
- 用java将html网页中的文本信息存入txt文件?
- 打开E盘快捷键,或者在我的电脑里快速找到文件的快捷键
- 在Win下安装Vim插件总结
- PHP面向对象学习之三:抽象类和接口类的实际作用
- all manipulators in c++
- HDU 3062 Party (2-SAT入门学习)
- Ubuntu10.04 Git安装
- Arlicle
- 关于typedef的用法总结