黑马程序员 分享一个牛叉的网页爬虫

来源:互联网 发布:男生180女生160知乎 编辑:程序博客网 时间:2024/05/29 10:24

---------------------------------------------------------------- android培训、java培训、期待与您交流! ----------------------------------------------------------------------------------------

网页爬虫: 也叫蜘蛛,在互联网上爬着的虫,即网上寻找资源的小程序,分享一个能从网页上找到所需邮箱的程序。

import java.io.*;import java.util.regex.*;class RegexTest2 {public static void main(String[] args) throws Exception{getMail();}public static void getMail() throws Exception{BufferedReader bufr=new BufferedReader(new FileReader("mail.html"));//定义邮箱规则String regex="[a-zA-Z0-9_]{3,}@[a-zA-Z0-9]+(\\.[a-zA-Z]+){1,3}";Pattern p=Pattern.compile(regex);//让正则表达式与作用的字符串相关联,获取匹配器对象。String line=null;while((line=bufr.readLine())!=null){Matcher m=p.matcher(line);while(m.find()){System.out.println(m.group());}}bufr.close();}}

---------------------------------------------------------------- android培训、java培训、期待与您交流! ----------------------------------------------------------------------------------------