VIM解决中文编码问题

来源:互联网 发布:淘宝店铺手机怎么进入 编辑:程序博客网 时间:2024/05/29 08:11

虽然VIM自7.0之后对双字节的编码已经支持的很不错了,但是,还是需要一些配置才能完全实现的哦。

要解决的问题:

1.识别双字节编码格式

需要先了解的知识:

vim中的内置变量:

enc(encoding):vim的内部编码

fenc(fileencoding):vim解析出来的当前文件编码(有可能解析成错的哦)

fencs(fileencodings):vim解析文件时猜测的编码格式顺序列表

需要的配置:

1.vimrc中的代码如下:

123456789101112
set encoding=utf-8set fenc=cp936set fileencodings=cp936,ucs-bom,utf-8if(g:iswindows==1)    source $VIMRUNTIME/delmenu.vim    source $VIMRUNTIME/menu.vim    language messages zh_CN.utf-8endifif v:lang =~? '^/(zh/)/|/(ja/)/|/(ko/)'    set ambiwidth=doubleendifset nobomb

解释如下:

set encoding=utf-8这行是将vim的内部编码格式变为utf-8,这样vim识别文件正确的准确性会提高很多。set fenc=cp936是指当新建一个文件的时候,默认编码是gbk,而set fileencodings=cp936,ucs-bom,utf-8 这一行会让vim按照gbk,utf-8(没有头),utf-8的顺序识别。由于笔者的工作环境下大部分代码要求为gbk,所以才如上述设置,如果读者需要默认为utf-8格式,可以如下配置:

12
set fenc=utf-8set fileencodings=ucs-bom,utf-8,cp936

接下来:

12345
if(g:iswindows==1)    source $VIMRUNTIME/delmenu.vim    source $VIMRUNTIME/menu.vim    language messages zh_CN.utf-8endif

这段代码是防止菜单乱码。

123
if v:lang =~? '^/(zh/)/|/(ja/)/|/(ko/)'    set ambiwidth=doubleendif

是为了让vim能够默认以双字节处理那些特殊字符。

set nobomb 是让vim不要自动设置字节序标记,因为并不是所有编辑器都可以识别字节序标记的。

2.由于即便配置了上述的代码,也不一定能够100%认识对编码,所以推荐大家安装一款插件,是国人写的,挺不错的。

fencview.vim

这款插件集成了自动检测编码格式的能力,但是笔者测试过似乎不是很准,所以还是建议关掉自动检测,只有在vim检测失败的时候,才调出fencview,手动选择编码比较好。

在vimrc中配置如下:

123
"关闭自动检测let g:fencview_autodetect=0map <F2> :FencView<cr>

这样按下F2就可以直接呼出fencview界面,再按下就会关闭。

当然,如果您是一位经常处理多国编码的用户,那么可能直接安装fencview.vim,并且将自动检测打开会更好些,但是对于vim自己的控制就少了,我想作为vimer肯定不想如此吧,呵呵。

另外,按照上面的格式来配置vim的话,在保存文件时,是不会更改文件格式的,如果想要强制更改,例如要改成utf-8,可以用set fenc=utf-8来执行,之后写入即可。

好啦,就到这里。

 

转载自Vimer的程序世界 [ http://www.vimer.cn ]

本文链接地址: http://www.vimer.cn/2009/10/87.html