Java网页爬虫获取邮件地址
来源:互联网 发布:二木淘宝店 编辑:程序博客网 时间:2024/06/06 01:52
/*网页爬虫(蜘蛛)*/import java.io.*;import java.util.regex.*;import java.net.*;import java.util.*;class RegexTest2 {public static void main(String[] args) throws Exception{getMails_1();}public static void getMails_1()throws Exception{URL url = new URL("http://192.168.1.254:8080/myweb/mail.html");URLConnection conn = url.openConnection();BufferedReader bufIn = new BufferedReader(new InputStreamReader(conn.getInputStream()));String line = null;String mailreg = "\\w+@\\w+(\\.\\w+)+";Pattern p = Pattern.compile(mailreg);while((line=bufIn.readLine())!=null){Matcher m = p.matcher(line);while(m.find()){System.out.println(m.group());}}}/*获取指定文档中的邮件地址。使用获取功能。Pattern Matcher*/public static void getMails()throws Exception{BufferedReader bufr =new BufferedReader(new FileReader("mail.txt"));String line = null;String mailreg = "\\w+@\\w+(\\.\\w+)+";Pattern p = Pattern.compile(mailreg);while((line=bufr.readLine())!=null){Matcher m = p.matcher(line);while(m.find()){System.out.println(m.group());}}}}
————摘自《毕向东25天》
0 0
- Java网页爬虫获取邮件地址
- 正则表达式-网页爬虫-从服务器或本地文件获取邮件地址
- 使用正则表达式写一个网页爬虫案例获取指定文档中的邮件地址保存到自己指定的文件夹中
- 正则表达式的威力5_网页爬虫,爬邮件地址
- JAVA在网页上抓取邮件地址
- java在网页上面抓去邮件地址
- 【java爬虫】HttpClient4.5获取网页内容
- java爬虫--step1--简单网页获取
- 爬虫获取网页编码
- Java:java爬虫获取动态网页的数据
- Java 网络爬虫获取网页源代码原理及实现
- Java 网络爬虫获取网页源代码原理及实现
- Java 网络爬虫获取网页源代码原理及实现
- Java 网络爬虫获取网页源代码原理及实现
- JAVA 爬虫获取js动态生成的网页数据
- java爬虫小demo实现获取网页图片
- (正则表达式)邮件地址爬虫
- java网页爬虫
- AlertDialog的用法
- Docker学习笔记 — Docker私有仓库搭建
- arm9+linux fl2440 第一次开机烧录
- Centos6.5安装MySQL及常见问题
- Codeforces Beta Round #10 A. Power Consumption Calculation (模拟)
- Java网页爬虫获取邮件地址
- linux命令
- 2016-5-2
- 互联网服务端技术——如何学(中)
- 数据选择控件-UIPickerView的总结
- 3.0版本opencv+3.4版本的python
- WPS中公式与文字无法居中对齐
- java实现快速排序、插入排序、选择排序、冒泡排序算法
- STL栈 - 使用栈实现进制转换