正则表达式(模拟网络爬虫、网络蜘蛛)

来源:互联网 发布:淘宝店家培训 编辑:程序博客网 时间:2024/06/05 01:27
网络爬虫(网络蜘蛛)
    需求:获取邮箱
  1. package com.cn.regex;
  2. import java.util.regex.Matcher;
  3. import java.util.regex.Pattern;
  4. /**
  5. * Author:Liu Zhiyong(QQ:1012421396)
  6. * Version:Version_1
  7. * Date:
  8. * Desc:
  9. 网络爬虫(网络蜘蛛)
  10. */
  11. public class Demo4 {
  12. public static void main(String[] args) {
  13. String str = "有事请联系:1012421396@qq.com 有事请联系:396@qq.com 有事请联系:1012421396@qq.com.cn 有事请联系:1012421396@qq.net 有事请联系:1012421396@qq.cn 有事请联系:1012421396@163.com";
  14. String regex = "[a-zA-Z1-9]\\w{5,17}@[a-zA-Z0-9]{2,}(\\.(com|cn|net)){1,2}";
  15. //把字符串的正则编译成正则对象
  16. Pattern p = Pattern.compile(regex);
  17. //使用正则对象产生匹配器对象
  18. Matcher m = p.matcher(str);
  19. while(m.find()){
  20. System.out.println(m.group() );
  21. }
  22. }
  23. }
0 0
原创粉丝点击