java正则表达式匹配网页email(email抓取)

来源:互联网 发布:mac虚拟机安装win7下载 编辑:程序博客网 时间:2024/06/05 15:41

package com.regExp;

import java.io.BufferedReader;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class CatchAllEmal {

 /**
  * @param args
  */
 public static void main(String[] args) throws Exception {
  // 注意以^开始及以$结束将行开始与行结束
  String regEx="[a-zA-Z//d]+[a-zA-Z_//-//d]+(//.[a-zA-Z_//-//d]+)*@[a-zA-Z_//-//d]+(//.[a-zA-Z_//-//d]+)+";
  Pattern p=Pattern.compile(regEx);
  Matcher m=null;
  URL url=new URL("http://tieba.baidu.com/f?kz=496274307");
  InputStream is=url.openStream();
  BufferedReader br=new BufferedReader(new InputStreamReader(is));
  String line=br.readLine();
  while(line!=null){
   m=p.matcher(line);
   while(m.find()){
    System.out.println(m.group());
   }
   line=br.readLine();
  }
  br.close();
 }

}

原创粉丝点击