jsoup解析网页出现转义符问题
来源:互联网 发布:杭州淘宝网店诈骗 编辑:程序博客网 时间:2024/06/03 17:36
https://www.oschina.net/question/996055_136438
*******************************************************
我要解析这个网页 http://sports.163.com/13/0830/22/97IFSI5I00051CD5.html
然后直接在获得源码后,使用select 只捕获其中一部分 doc.select("textarea[id^=photoList]")
为何出现了这个情况呢、求大牛们帮忙解决啊 @红薯很奇怪的是,我用转义符全部替换之后,直接打印在控制台,显示正确,然后又用Jsoup.parse()这个方法,结果又成了这样子、大神们,帮帮忙吧@jsoup
html()和outerHtml()的区别只是有没有包含本层而已,最终底层方法是一样的,所以这里确实转义了。
其实也说得通,因为textarea里的内容是“文本”,html里的纯文本内容,如果不进行转义是不安全的。
当然这里你的需求是"保持原文",“转义再反转”其实是无法保持原文的。而且Apache的StringEscapeUtils的转义范围比Jsoup要小,所以其实反转是不完整的。
有个比较hack的方法:
Document doc = Jsoup.connect("http://sports.163.com/13/0830/22/97IFSI5I00051CD5.html").get();//清空jsoup的转义表,会使jsoup失去转义能力Entities.EscapeMode.base.getMap().clear();Elements elements = doc.select("textarea[id^=photoList]");for(Element e:elements){ System.out.println(e.html());}
阅读全文
0 0
- jsoup解析网页出现转义符问题
- 关于Jsoup解析https网页的问题
- 网页解析利器Jsoup
- 网页解析利器Jsoup
- Jsoup 解析Html网页
- Jsoup解析网页
- 网页解析之Jsoup
- jsoup解析网页二
- Jsoup解析网页内容
- 使用Jsoup解析网页
- Android使用jsoup解析网页
- Android:使用jsoup解析网页
- java 网页解析工具包 Jsoup
- httpClient获取Jsoup解析网页
- java 网页解析工具包 Jsoup
- 使用Jsoup解析html网页
- java 网页解析工具包 Jsoup
- 使用Jsoup解析html网页
- 205. Isomorphic Strings
- 错误记录(八)could not initialize proxy
- 2017.05.27回顾
- Banana Pi M2U系列之二:Uboot编译
- 获取iOS任意线程调用堆栈(五)完整实现:BSBacktraceLogger
- jsoup解析网页出现转义符问题
- Android最详细的Alibaba-AndFix 热修复框架的使用
- Spring Boot下如何自定义Repository中的DAO方法
- Jquery设置select控件指定text的值为选中项
- MySQL5.7安装步骤
- NSNotificationCenter 的使用详解
- linux proc maps文件分析
- 学习kotlin第七天_类与继承、属性与字段
- ByteBufferMessageSet分析