Jsoup.connect(url).get()解析html页面空格&bsp乱码问题
来源:互联网 发布:如何用excel做数据库 编辑:程序博客网 时间:2024/06/14 09:46
使用jsoup写网络爬虫时,通过Jsoup.connect(url).get()获取html页面,在解析的过程中经常出现 空格乱码问题,其他中文字符能够正常输出
下面代码给出了一个例子,解决空格乱码问题
public void parseUrl(String url) {
try {
Document doc = Jsoup.connect(url).get();
// String text = doc.select("div.txt_p").text(); 没有处理 空格之前
String text = doc.select("div.txt_p").text().replace(Jsoup.parse(" ").text(), " ");
//使用replace(Jsoup.parse(" ").text(), " "); 将 替换为普通的空格
//div.txt_p为选择解析html页面的一个属性
System.out.println(text );
} catch (IOException e) {
e.printStackTrace();
}
}
0 0
- Jsoup.connect(url).get()解析html页面空格&bsp乱码问题
- Jsoup.connect(url).get()解析html页面空格&bsp乱码问题
- Jsoup处理html空格乱码问题
- 解决Jsoup解析html页面空格( )解析为乱码(问号)
- 使用Jsoup解析HTML页面
- 使用Jsoup解析HTML页面
- 使用jsoup解析html页面
- 使用Jsoup解析HTML页面
- 关于利用Jsoup解析HTML中 ;变成非传统空格或乱码问题解决方法
- 关于利用Jsoup解析HTML中 ;变成非传统空格或乱码问题解决方法
- Jsoup处理Url与解析Html
- Android 使用Jsoup解析HTML页面
- java-jsoup解析html页面的内容
- Android使用Jsoup解析HTML页面
- java-jsoup解析html页面的内容
- Android开发--使用JSOUP解析HTML页面
- HTML页面解析组件-Jsoup使用
- 关于jsoup抓取html空格出现乱码的解决办法
- 自己在win10中添加ADO控件步骤总结
- Class.forName()用法详解
- js与php传递参数
- POJ 2485 Highways
- Centos 6.5 64bit安装RStudio server
- Jsoup.connect(url).get()解析html页面空格&bsp乱码问题
- VS2010 C++ 大杂烩
- uestc The Desire of Asuna 1263 (递推模拟)
- hdoj N!
- echarts开发流程详解
- 组合模式
- C语言的问题,关于temp参数的一些知识
- UESTC 1263-The Desire of Asuna
- iOS之 json数据解析