网站的轮播图的获取
来源:互联网 发布:淘宝买东西领淘金币 编辑:程序博客网 时间:2024/05/01 04:34
获取某网站的轮播图
/** * 获取轮播图 * * @author Michael * @param newsUrl * @return */ public List<Map<String, String>> crawler4Pic(String newsUrl) { List<Map<String, String>> picList = new ArrayList<Map<String, String>>(); try { Document newsPageDoc = Jsoup.connect(newsUrl) .header("Content-Type", "text/html; charset=GB2312") .header("Accept-Language", "zh-CN,zh;q=0.8").timeout(3000) .get(); // 获得当前页面的Dom String picString = newsPageDoc.select("script").eq(5).toString() .split("var data = ")[1].split(";")[0]; JSONArray picArray = JSONArray.fromObject(picString); for (int i = 0; i < picArray.size(); i++) { Map<String, String> picMap = new HashMap<String, String>(); String picUrl = picArray.getString(i).split("\"")[3]; String titleUrl = picArray.getString(i).split("\"")[7] + ":" + picArray.getString(i).split("\"")[11]; picMap.put("picUrl", picUrl); picMap.put("title", titleUrl); picList.add(picMap); System.out.println("picUrl: " + picUrl + " title: " + titleUrl); } } catch (Exception e) { e.printStackTrace(); } // System.out.println("picList =" + picList); return picList; } /** * @param args */ public static void main(String[] args) { BBMCCrowler bbmc = new BBMCCrowler(); bbmc.crawler4Pic("http://www.bbmc.edu.cn/"); }
0 0
- 网站的轮播图的获取
- 获取rfc的网站
- 获取网站的信息
- 获取网站的根目录
- 黑客获取网站的密码
- 获取数据的网站集锦
- php获取网站的绝对路径
- 获取指定网站的内容
- 获取网站的根目录信息
- 获取网站的IP地址
- 获取出口IP的网站
- 【ahk】获取网站的源代码
- 如何获取网站的webshell
- 获取网站title的图标
- 获取指定网站的时间
- XmlHttp异步获取网站数据的例子
- XmlHttp异步获取网站数据的例子
- XmlHttp异步获取网站数据的例子
- 第六届河南省程序设计大赛
- jquery
- Fastjson内幕
- iOS开发真机调试证书导出.p12文件
- 数据结构—二叉树后序遍历求逆
- 网站的轮播图的获取
- Android线程的创建、开启、休眠、中断
- 第十四周项目 3 数组类模板
- Flume概述
- 判断php的运行模式
- 使用Apache CXF开发Web Service步骤
- 第1课时《Qt osgEarth 编程入门》
- Browsersync的简单使用
- Program3_U