对一个HTML源码,用java正则提起其中的URL
来源:互联网 发布:continue在c语言 编辑:程序博客网 时间:2024/06/05 00:10
下面把源码发出来,如果不对的地方,欢迎指出来,我去改过来
以后,我专门抽些时间,对这些文章,回头看看,哪些地方写错,就改过来!
/**
*
*/
package com.bj.csdn;
import java.io.BufferedInputStream;
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.Reader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* @author zy
* @date 2016年4月4日 下午2:25:18
*/
public class ReadURL {
public static void main(String[] args) throws IOException {
// 设置输入文本路径
readTheURL("f:\\1.txt");
}
/**
* @param string
* @throws IOException
*/
private static void readTheURL(String path) throws IOException {
// TODO Auto-generated method stub
// 输入流
BufferedReader br = new BufferedReader(new FileReader(path));
/**
* String和StringBuffer他们都可以存储和操作字符串,即包含多个字符的字符串数据。
* String类是字符串常量,是不可更改的常量。而StringBuffer是字符串变量,它的对象是可以扩充和修改的。
*/
StringBuffer sb = new StringBuffer();
String line = null;
while ((line = br.readLine()) != null) {
// 读入内存
sb.append(line);
}
// 匹配RUL正则
Pattern p = Pattern.compile("http://www.91daoqi.com/city/[a-z]{2}/information.php\\?id=\\d{3}");
Matcher m = p.matcher(sb);
// 设置输出文本路径和文本名
File file = new File("f:\\d.txt");
//如果文件不存在,就创建一个文件
if (!file.exists()) {
file.mkdirs();
}
byte[] bt = new byte[1024];
// File file = new File("d:\\array.txt"); //存放数组数据的文件
FileWriter out = new FileWriter(file); //文件写入流
while (m.find()) {
//bt = m.group().getBytes();
out.write(m.group());
}
// 关闭流,释放资源
br.close();
out.close();
}
}
- 对一个HTML源码,用java正则提起其中的URL
- 用正则表达式提取html中的一个指定div对
- 解决java用url中读取html源码时的乱码问题
- 用java写一个多线程程序,其中两个对一个变量加1,另两个对一个变量减1
- java的String类中的其中一个subString方法的源码
- 通过一个小小的问题提起良好习惯的养成
- 一个保存有10000个URL的文本文件,删除其中相同的URL。
- 一个url的正则验证式子
- C#根据特定URL网址获取网页源码(完整html代码)后用正则式匹配得到目标串
- 用java写一个多线程程序,如四个线程,其中两个对一个变量加1,另两个对一个变量减1
- java版的webservice,完全用java的正则表达式对websercice的xml进行解析,可以很快用到web中,只需要调用其中的封装好的方法
- 使用独立的HTML文件的URL服务,并在其中引用服务器中的图片
- 一个URL正则表达式
- 在Java代码中解析html,获得其中的值
- 获取URL对应的HTML文档及用正则做replace
- 其中的一个作业
- php正则匹配html中的带class的div,选取其中的内容
- 判断html是否闭合的一个正则
- angular学习:npm启动后不能访问http://localhost:8000/
- Oracle decode函数
- 利用阿里大鱼下发短信验证码
- 网络编程的技术要点
- MediaPlayer播放一般音频与SoundPool播放短促的音效
- 对一个HTML源码,用java正则提起其中的URL
- mysql中使用limit 分页
- C++中的static关键字
- android:padding和android:margin的用法及区别
- Android 6.0 使用 Apache HttpClient
- 转场动画
- JSON 工具包/常见Mapping
- iOS运行时显示--Could not find Developer Disk Image
- string 与char* char[]之间的转换