技术博客三:JSOUP的简单应用
来源:互联网 发布:系统封装软件 编辑:程序博客网 时间:2024/05/21 17:51
Jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
Jsoup的大致原理:网站的HTML页面是由HTML标签和要显示的内容组成的,Jsoup的功能就是解析标签,获取内容,并根据标签的类型将内容分类,返回一个document结果集。
以解析某音乐网站为例子:
先将用户输入的关键词和音乐网站的网址进行拼接:
“http://www.xiami.com/search/song?Key=”+“关键词”
public static String KEY_SEARCH_URL = “http://www.xiami.com/search/song?key=“;
然后连接网络,得到网址页面内容后,使用Jsoup进行解析:
document = Jsoup.connect(KEY_SEARCH_URL + key).get();
// jsoup连接最终拼接而成的请求字符串
对比虾米音乐的搜索结果页面可以看出,所有搜索结果是放在一个 名为 track_list的 table中,而id则放在chkbox标签中。
于是先调用结果集合document和element的select()函数获得所有搜索到的歌曲的id,得到一个id数组。
再将音乐网站每一首音乐的页面网址与得到的数组中的id拼接:
“http://www.xiami.com/search/playlist?id=”+”歌曲id”
public static String ID_SEARCH_URL = “http://www.xiami.com/song/playlist/id/“;
得到单曲页面,然后就可以采用和上面相同的方式解析得到歌曲的详细信息啦。
- 技术博客三:JSOUP的简单应用
- 利用Jsoup解析网页,抓取数据的简单应用
- jsoup的简单介绍
- Jsoup的简单使用
- Jsoup的简单使用
- 我的技术博客三周年纪念
- 关于Jsoup的简单使用
- Jsoup实现简单的爬虫
- 好的技术博客、应用总结
- 如何写简单易懂的技术博客
- 反射的简单应用三
- Android应用开发-小巫CSDN博客客户端Jsoup篇
- Android应用开发-小巫CSDN博客客户端Jsoup篇
- Android应用开发-小巫CSDN博客客户端Jsoup篇
- 简单的页面缓冲技术(三)
- Jsoup加载HTML的三种方式
- iBATIS框架技术----一个简单的应用
- 使用Jsoup作为简单的http客户端
- 图文详解YUV420数据格式
- Mac平台的docker 代理之两个privoxy
- 技术博客二:Handler的机制
- Static
- 数据结构-队列
- 技术博客三:JSOUP的简单应用
- 详述ROWID的原理及其使用
- Activity初学乍练
- 网站架构 发展
- 技术博客四:用Listview显示列表
- jquery框架方法事件大全
- 奇异值分解(SVD)原理详解及推导
- FFMpeg详细简介
- 利用CSS3画三角形(另附百度笔试题)