程序博客网 > 道客巴巴软件

Jsoup 采集回来的信息出现乱码

来源：互联网发布：道客巴巴软件编辑：程序博客网时间：2024/05/16 09:19

一般出现这个情况是由于url指向的页面，实际编码与html中描述的编码不符导致。如：开发时用的GBK编码编写，但html中却写UTF-8。典型的就是在中文Windows下用记事本，写一个UTF-8的html就会出现这个问题。

你可以不用jsoup.connect，这个会从html描述中识别。

你可以用Jsoup.parse(InputStream in, String charsetName, String baseUri) 的方式从一个流中读取，charsetName选择合适的编码。

如：

String url = "http://xxxxxxx";
Document document = Jsoup.parse(new URL(url).openStream(), "GBK", url);
//你可以试试GBK或UTF-8

p.s.

编码问题： new String(docStr.getBytes("ISO8859-1"), "UTF-8"); 方式绝对不是正确解决之道

0 0

道客巴巴软件

道客巴巴软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子庐山旅游攻略住宿南昌庐山一日游庐山三日旅游攻略九江到庐山二日游江西庐山旅游线路庐山风景区的酒店江西庐山门票江西省庐山风景名胜区庐山旅游景点大全庐山瀑布旅游攻略庐山三叠泉旅游攻略武汉去庐山自由行十一庐山旅游攻略九江庐山旅馆预订庐山旅游注意事项去庐山玩住哪里好庐山2日游的详细线路庐山风景区门票庐山是哪里的庐山住哪里比较好庐山门票优惠庐山哪些景点要门票上海庐山旅游攻略庐山和黄山哪个好玩庐山旅游两日游庐山旅游报团 lushan 西海在哪里西海旅游自助游九江火车站到庐山景区九江火车站到庐山庐州月吉他谱庐州月简谱庐州月mp3下载合肥庐州太太庐州老窖特曲庐州老窖头曲52度价格合肥江山庐州印徽盐庐州茂庐州卫生科技学校