读取Unicode格式TXT文件问题

来源:互联网 发布:在线办公软件qq 编辑:程序博客网 时间:2024/06/05 15:50

问题:

由于本来windows的txt后缀文件读取格式默认为ansi,但是为了在mfc中读取中文字符

使用CStidFile打开文件直接读取会出现乱码


文件转换:

1.先将ansi格式文档另存为unicode文档

2.打开文件模式添加CStdioFile::typeUnicode


查询方便:

为了方便查寻,所以将字符对照表写进txt文件,每次读完一次对照表就写入unordered_map中

每次循环调用unordered_map时,可以直接进行查找而省去了硬编码的部分

但是在查询时unordered_map,明明是有key值的,但是却查询失败,返回end


到此为止,问题已经持续几个小时了!!


原因:

使用CString的getlength函数,查到,读取第一个词组时,unicode格式txt文件包含2个字节的字节头!!!!!

所以每次找匹配时,都是错误的!!

遂在打开文件后,先将文件后移2个字节,问题解决

CStdioFile file;

file.Open(_T("D://1//test.txt"), CStdioFile::modeRead | CStdioFile::typeUnicode);

file.Seek(2, CFile::begin);

0 0
原创粉丝点击