Jsoup 解析带有空格的Class
来源:互联网 发布:彩印编织袋价格算法 编辑:程序博客网 时间:2024/06/05 03:32
jsoup使用样式class抓取数据时空格的处理
最近在研究用android和jsoup抓取小说数据,jsoup的使用可以参照http://www.open-open.com/jsoup/;在抓纵横中文网永生这本书的目录内容时碰到了问题,
永生的书简介url http://book.zongheng.com/book/48552.html中,我要抓取 <aclass="button read" href="http://book.zongheng.com/showchapter/48552.html">点击阅读</a>这个链接的url 再根据这个url到索引页,解析索引页的章节目录和链接。使用jsoup抓取class可以直接这样调用
Document doc = Jsoup.parse("http://book.zongheng.com/book/48552.html");
doc.select(".button read");尝试后发现class中有空格无法抓到对应链接。上百度搜了一圈找到http://hi.baidu.com/chen88358323/item/459090031758c691a3df4389
这个解决方案不太好。想到jsoup和jquery的selec机制很像,又查到了http://zhidao.baidu.com/question/311666643.html。这篇文章很有启发。
最后经过测试发现带空格的class可以写成两个select
写成 Elements indexEs = doc.select(".button").select(".read");成功抓取该书所有目录和链接。
点击打开链接
- Jsoup 解析带有空格的Class
- python beautifulsoup select带有空格的class
- Jsoup爬虫是class有多个空格无法解析
- jsoup getElementsByClass 遇到空格无法解析的解决办法
- Jsoup解析时ClassName中存在空格的问题
- 读取带有空格的字符串
- jsoup对Html的解析
- jsoup,html解析的利器
- jsoup解析的常见用法
- Jsoup库,HTML的解析
- c++中输入带有空格的字符串
- c++输入带有空格的string
- C++中输入带有空格的字符串
- 输入一个带有若干空格的字符串
- Bash循环处理带有空格的文件名
- scanf读取带有空格的字符串
- [Jsoup] Jsoup解析中需要注意的问题
- jsoup解析
- ios自动布局
- (转)iOS 8 AutoLayout与Size Class自悟
- oracle11g锁定密码及默认密码有效期180天
- JVM 常量池理解
- oscache缓存使用总结
- Jsoup 解析带有空格的Class
- android soap2协议访问webservice的有关问题
- 操纵JsonObject的方法
- Java输入输出流
- MFC RichEdit的用法汇总
- vtk中vtkRenderer各函数解析
- Genymotion模拟器1
- TopCoder SRM 652 Div2 Problem 1000 - NoRightTurnDiv2 (几何 + 贪心)
- 让那些做面试官的屌丝lead不再抖脚系列(三)---同步异步探讨->lock