读取html文件内容乱码处理
来源:互联网 发布:网站seo方案 编辑:程序博客网 时间:2024/05/22 01:53
1.乱码 先读出 所有的字节码 然后在转换成 需要的字符串
正确方式:
ByteArrayOutputStream outHtml = new ByteArrayOutputStream();
InputStream inn = conn.getInputStream();
byte[] buffer = new byte[1024];
int len = 0;
while((len = inn .read(buffer))!= -1 ){
outHtml.write(buffer,0,len);
}
byte[] data = outHtml.toByteArray();
logger.info("转换前utf-8:"+new String(data,"utf-8"));
InputStream inputStream = new BufferedInputStream(inn);
StringBuffer htmlContent = new StringBuffer();
byte[] b = new byte[1024];
for (int n; (n = inputStream.read(b)) != -1;) {
htmlContent.append(new String(b, 0, n,"utf-8"));
}
logger.info("获取时:"+htmlContent.toString());
正确方式:
ByteArrayOutputStream outHtml = new ByteArrayOutputStream();
InputStream inn = conn.getInputStream();
byte[] buffer = new byte[1024];
int len = 0;
while((len = inn .read(buffer))!= -1 ){
outHtml.write(buffer,0,len);
}
byte[] data = outHtml.toByteArray();
logger.info("转换前utf-8:"+new String(data,"utf-8"));
错误方式: 是什么导致的乱码呢 为啥本地环境不乱码 到运行环境就乱码呢 难道仅仅是因为 可能读取不全字节 转string 时出现的转码错误?
InputStream inn = conn.getInputStream();InputStream inputStream = new BufferedInputStream(inn);
StringBuffer htmlContent = new StringBuffer();
byte[] b = new byte[1024];
for (int n; (n = inputStream.read(b)) != -1;) {
htmlContent.append(new String(b, 0, n,"utf-8"));
}
logger.info("获取时:"+htmlContent.toString());
0 0
- 读取html文件内容乱码处理
- io读取文件内容乱码处理
- Unicode 文件内容读取乱码
- 读取html网页文件内容
- C#读取HTML文件内容写入记事本
- java读取properties文件,中文乱码处理
- 抓取HTML内容的空格处理,数据库空格乱码
- 用c#读取文件内容中文是乱码的解决方法
- 用c#读取文件内容中文是乱码的解决方法
- Android学习笔记之读取文件内容乱码问题
- android中读取txt文件内容防止出现乱码
- common.io中Tailer类读取文件内容乱码问题解决
- java读取html文件乱码和java保存html文件乱码 解决方案
- php读取html内容
- 【java】读取html乱码
- html a href 文件下载 IE直接打开 内容乱码
- html乱码,文件乱码
- IOS本地读取HTML文件内容 适合新手试试
- Android Studio AIDL创建案例(解决自动生成java问题)
- 初试redis集群
- poj3061 Subsequence(尺取法)
- Lua 数组
- 深度学习算法的几个难点
- 读取html文件内容乱码处理
- 查看连接zk的服务是那些
- [BZOJ3513][MUTC2013]idiots(FFT+组合数学)
- SQL Server 2008 R2导出数据脚本的方法
- 迷宫问题
- 代码即正义
- 生成ssh公钥并连接到github
- maven教程
- 输出最长回文子序列字符数