nodejs文件读取中文乱码问题

来源：互联网发布：it have 还是it has 编辑：程序博客网时间：2024/05/18 15:25

参考自《深入浅出nodejs》

Buffer对象类似于数组，元素为16进制的两位数，0-255的数值是二进制，与字符串有编码的关系

Buffer对象可以与字符串之间相互转换，目前支持：ASCII，UTF-8，UTF-16LE/UCS-2，Base64，Binary，Hex

转为buffer： new Buffer(str,[encoding])

转为字符串：buf.toString([encoding],[start],[end])

乱码发生在buffer的拼接

var fs=require('fs');var rs=fs.createReadStream('test.md');var data='';rs.on('data',function(trunk){    data+=trunk;})rs.on('end',function(){    console.log(data);})

其实data+=trunk 相当于 data=data.toString()+trunk.toString();

解决方法一：

可读流设置编码readable.setEncoding(encoding);

var rs=fs.createReadStream('test.md');rs.setEncoding('utf8');

解决方法二：

把多个小buffer拼接成一个大Buffer

var chunks=[];var size=0;res.on('data',function(chunk){    chunks.push(chunk);    size+=chunk.length;});res.on('end',function(){    var buf=Buffer.concat(chunks,size);    var str=iconv.decode(buf,'utf8');    console.log(str);});

使用Buffer进行文件读取和网络传输，性能比直接纯字符串将近快一倍

0 0