Java实现简易爬虫--抓取酷安网用户头像
来源:互联网 发布:embed js控制声音大小 编辑:程序博客网 时间:2024/05/17 19:58
转载自:http://blog.csdn.net/e_one/article/details/60876076
爬虫思路
以酷安网用户粉丝较多的用户的个人中心为进口,获取该用户的全部粉丝的个人中心链接,用户头像链接和用户名,并分别放入队列。开启两个线程获取信息,一个线程获取队列中的用户的信息并放入队列,另一个线程负责从头像链接队列中取出链接并下载用户头像。
爬虫分析
用浏览器打开一个用户的粉丝列表(http://coolapk.com/u/[用户id]/contacts)
并查看源码
我们可以看到粉丝列表以HTML的ul标签显示,并且其id为dataList,ul标签中的各个li标签即为每一个用户的信息啦~再进一步分析,li标签中的img标签为用户头像。h4标签的内容即为用户名,h4标签中的a标签的href属性为用户的个人中心链接。
通过观察我们还知道:用户的粉丝列表链接=个人中心链接+ "/contacts"
这样我们就可以开始爬取头像了
用到的库
Jsoup https://jsoup.org/download
HttpClient http://hc.apache.org/downloads.cgi
代码
Main.Java
MyQueue.java
效果图
0 0
- Java实现简易爬虫--抓取酷安网用户头像
- Java实现简易爬虫--抓取酷安网用户头像
- java爬虫实现数据抓取
- 实现简易Java网络爬虫
- Java爬虫,信息抓取的实现
- java实现网络爬虫--抓取网站数据
- Java爬虫,信息抓取的实现
- Java爬虫,信息抓取的实现
- 用JAVA实现简单爬虫循环抓取
- 用JAVA实现简单爬虫多线程抓取
- Java爬虫,信息抓取的实现
- Java爬虫,信息抓取的实现
- Java爬虫,信息抓取的实现
- Java爬虫,信息抓取的实现
- Java爬虫,信息抓取的实现 [转]
- Java爬虫,信息抓取的实现
- Java爬虫,信息抓取的实现
- java爬虫,信息抓取的实现手法
- [LeetCode] 135. Candy java
- Java中final修饰参数的作用
- 安卓按钮点击事件的四种写法
- Java运算符优先级
- Android VPN实现原理介绍
- Java实现简易爬虫--抓取酷安网用户头像
- ios调用系统地图时候的细节问题- (void)locationManager:(CLLocationManager *)manager didUpdateLocations:(NSArray *)l
- smmu 学习笔记之get_sgtable
- js 整除实现方法性能比较
- BigDecimal的精确计算
- [LeetCode] 136. Single Number java
- sklearn-数据预处理
- 关于 Android 适配,看完这篇文章就够了
- XP和WIN10环境变量比较