fstream 和 中文路径 [转]

来源:互联网 发布:熊市炒股公式源码 编辑:程序博客网 时间:2024/05/21 00:50

近来碰到在Visual Studio 2005 环境下碰到fstream不能打开中文路径问题后,网上搜集了一些解决方案,摘录如下:

fstream 和中文路径
有时候用ifstream或ofstream打开带有中文路径的文件会失败。

解决办法:
1、使用C语言的函数设置为中文运行环境
setlocale(LC_ALL,"Chinese-simplified");

2、使用STL函数设置为系统语言环境
std::locale::global(std::locale(""));

当然选2啦!

另转载针对该问题的详细讨论:http://haoren.blogbus.com/logs/2278697.html

前两天写的一个程序里面,发现中文路径扫描有问题,无法得出带有中文路径的文件的CRC值以及文件大小。因为这两个获得都是通过fstream实现的,跟踪了一下发现2005中的fstream对中文路径处理存在BUG。

跟踪后找到问题所在,原来2005中为了让std::wfstream(这个是MS自己搞的东西,C++标准中并未规定有wfstream)的路径支持wchar_t,所有底层函数的路径都是转换成wchar_t来进行操作的。而在此之前VC2003的wfstream并不支持wchar_t作为路径,写STL的人并未使用MS的标准API:MultiByteToWideChar及WideCharToMultiByte来进行wchar_t和char之间的转换,而是用了C库的wcstombos来进行转换。而wcstombos并不像MultiByteToWideChar这样的函数可以在参数中指定代码页设置,它只接受当前全句的locale设置。当全局的locale设置并不为wcstombos所要转换的文字的代码页时,BUG就出现了。

默认的locale设置为ANSI C,通过设置代码页为".936"可以解决中文DBCS到UNICODE的转换。因此,如果要解决这个BUG可以:

setlocale(LC_CTYPE, ".936");

设置全局locale来解决。不过
这样将导致全局的locale改变。wcstombos是标准C库中的函数,并非STL中的库函数,所以无法只用locale类来对它造成单一影响。这么设置的话,有可能std::cout将无法正确输出中文名,造成的影响似乎有点得不偿失。所以这个BUG最好不要用这种方式解决。还是等MS的SP补丁出来看看是否解决了这个问题。在此之前可以考虑用C库的fopen来代替fstream.

最后:上面说过fstream底层都是用wchar_t来处理路径的,如果事先把路径转换成wchar_t传入进去也是可以的,但是这样也会带来一些问题:比如说VC2005以前的编译器将无法编译。

另转载对进行上述修改后造成的cout无法输出中文的解决方案:http://elanso.com/ArticleModule/HaHGMbTDPKHaSYHQSsSEM6Ii.html

前几天发了这篇《用fstream对二进制文件的读写》,有朋友指出了VS2005的fstream对于中文路径支持不好的bug。我想大概是因为VS2005更加重视了对字符串的全球化支持,所以鼓励我们使用unicode编码的字符串,对于MBCS之类的支持可能就疏忽了吧。

   我搜索了一下这个问题的解决,参考了如下资料写了演示代码。

  • fstream 和 中文路径  c++博客
  • About unicode settings in visual studio 2005, it really puzzled me a lot ms forum
  • MSDN

   我综合了以上的内容,总结了3种方法,能够较好解决大家的困扰,包括可能无法使用cout的问题。

  

补充一下,第一种方法,如果不是静态字符串当作路径的话,记得传入TCHAR*类型字符串作为路径,应该就没问题了。

 

以上转载自:http://jackinelee.blog.hexun.com/20954695_d.html

原创粉丝点击