利用Jsoup爬取天猫列表页数据
来源:互联网 发布:php curl get 数据 编辑:程序博客网 时间:2024/05/29 18:46
由于技术有限天猫详细页的销售数据爬取不到,所以采用折中的方法改为爬列表页.
本文针对的是店内搜索页
以下是获取网页数据:
/** * @param URL 根据URL获取document */public static Document getDocument(String URL) {Connection conn = null;Document doc = null;int count = 0;while (doc == null && count < 3000) {try {conn = Jsoup.connect(URL);doc = conn.get();} catch (IOException e) {e.printStackTrace();}count++;}return doc;}
解析网页中的节点,获取数据
/** * @param prdListUrl * :产品所在 列表页 * @param dataId * :产品的数据ID * @throws Exception */public static Map<String,String> getProductInfo(String prdListUrl,String dataId) throws Exception{Map<String,String> productInfo = new HashMap<String,String>();Document doc = GetTmall.getDocument(prdListUrl);Elements div_J_TItems = doc.select(".J_TItems");if(div_J_TItems!=null && !div_J_TItems.isEmpty()){Elements item5line1s = div_J_TItems.get(0).children(); for(Element item5line1 : item5line1s ){Elements items = item5line1.select(".item ");if(items != null && !items.isEmpty()){for(Element item : items){String prdId = item.attr("data-id");if(prdId.equals(dataId)){Elements c_prices = item.select(".detail .attribute .cprice-area .c-price");productInfo.put("price", c_prices.get(0).text());Elements sale_nums = item.select(".detail .attribute .sale-area .sale-num");productInfo.put("saleNum", sale_nums.get(0).text());}}}}}//System.out.println("商品网址:"+prdListUrl+" 商品编号 :"+dataId);//System.out.println("销售量:"+productInfo.get("saleNum")+"销售价:"+productInfo.get("price"));return productInfo;}
0 0
- 利用Jsoup爬取天猫列表页数据
- 无限分类,列表页数据展现
- 利用jsoup处理字符串
- 利用Jsoup解析HTML
- 利用jsoup解析html
- 利用Jsoup实现登录
- 利用jsoup扒新闻
- Android 利用jsoup解析 html
- Android 利用jsoup解析 html
- java利用JSOUP解析html
- Android 利用jsoup解析 html
- Android 利用jsoup解析 html
- 利用Jsoup抓取网络数据
- 利用 jsoup 解析 html内容
- 利用 jsoup 下载保存文件
- 利用jsoup小试牛刀[待编辑]
- viewpager更新某一页数据
- 代码3 爬取贴吧多页数据
- Apache运行机制剖析
- [leetcode] Regular Expression Matching
- Android学习(6)-UI介绍
- 数据库事务隔离级别
- appium之java API(2) -TouchAction
- 利用Jsoup爬取天猫列表页数据
- spring MVC 3.0.5+Spring 3.0.5+MyBatis3.0.4全注解实例详解(二)
- Address already in use: JVM_Bind
- IOS事件传递之hitTest:withEvent - IOS开发...
- Android Studio 的一些简单配置
- 外连接和内连接
- 项目总结——MongoDB入门
- 2014.1 网易游戏平台开发实习面试总结
- ASP.NET使用Cookie简单实现记住登陆状态功能