我的Android笔记(八)—— 使用Jsoup解析Html
来源:互联网 发布:手机淘宝在哪买彩票 编辑:程序博客网 时间:2024/06/02 00:58
想要做一个看新闻的应用,类似Cnbeta客户端的东西。大致思路如下:根据链接获取新闻列表页的html代码,然后解析,找到所有的新闻标题和新闻链接用listView显示,当点击ListView的Item再加载相应的新闻内容。
其中获取html代码,可以使用如下代码实现:
public String getHtmlString(String urlString) {try {URL url = new URL(urlString);URLConnection ucon = url.openConnection();InputStream instr = ucon.getInputStream();BufferedInputStream bis = new BufferedInputStream(instr);ByteArrayBuffer baf = new ByteArrayBuffer(500);int current = 0;while ((current = bis.read()) != -1) {baf.append((byte) current);}return EncodingUtils.getString(baf.toByteArray(), "gbk");} catch (Exception e) {return "";}}
传入一个网页链接,将返回此链接的html代码(String)。
然后就是解析此html代码了。经过google,发现了java的一个很好用的解析html的库,Jsoup:http://jsoup.org/
很容易使用,方法类似javascript和JQuery。只需先构建一个Jsoup的Document对象,然后就可以像使用js一个解析html了
String htmlString = getHtmlString("http://www.cnbeta.com");Document document = Jsoup.parse(htmlString);比如要获取cnbeta的html的title,只需:
String title = document.head().getElementsByTag("title").text();
另外构建Document的时候也可以直接使用URL,像这样:
Document doc = Jsoup.parse(new URL("http://www.cnbeta.com"), 5000);其中5000是连接网络的超时时间。
有关Jsoup的下载和更多介绍,见其官网:http://jsoup.org/
我写的一个demo,点击按钮后会加载然后显示cnbeta首页的所有新闻标题和链接地址,下载:http://download.csdn.net/detail/barryhappy/4151450 ,zip包里有jsoup的jar包,导入项目后可能需要手动导入此jar包。
运行效果图——
- 我的Android笔记(八)—— 使用Jsoup解析Html
- 我的Android笔记(八)—— 使用Jsoup解析Html
- 我的Android笔记(八)—— 使用Jsoup解析Html
- 我的Android笔记(八)—— 使用Jsoup解析Html
- 我的Android笔记(八)—— 使用Jsoup解析Html
- Android笔记—— 使用Jsoup解析Html
- Android 使用Jsoup解析HTML
- Android学习笔记:Jsoup解析、截取HTML
- Android 使用Jsoup解析HTML页面
- Android使用Jsoup解析HTML页面
- Android 使用Jsoup解析html+下载图片
- Android Jsoup解析HTML部署与使用
- Android开发--使用JSOUP解析HTML页面
- android jsoup解析html
- android jsoup 解析 Html
- 使用Jsoup解析html
- 使用Jsoup解析Html
- 使用Jsoup解析Html
- 总结性临时资料
- C#冒泡排序法
- 三项实测:7-Zip与WinRAR哪个好
- 排序算法
- 第四周 任务一
- 我的Android笔记(八)—— 使用Jsoup解析Html
- 五周任务一:设计三角形类,通过增加构造函数,使对象在定义时能够进行初始化
- shell脚本中的几个括号总结(小括号/大括号/花括号)
- IT交流咨询互动
- 程序与生活:为什么要工作?
- parasoft c++Test9.0破解
- 如何判断字符串是否为空串?string.length的优越性
- 在线分析和共享源代码
- 数组类模板