Ubuntu下打开文件乱码及编码转换
来源:互联网 发布:微课制作软件 免费版 编辑:程序博客网 时间:2024/04/28 08:12
1. 在文档所在目录运行命令
iconv -f gb2312 -t utf8 -c 1.txt > 2.txt
选项-c的作用是忽略不能识别的字符,继续向后转换。否则iconv遇到不能识别的字符就终止转换。
iconv不能实现批量转换,你需要写一段小程序来达到此目的。
2. 运行命令
ubuntu默认的打开.txt文件用的是gedit,可gedit默认编码是UTF8,打开windows下编辑的gb2312的文档都是乱码{Windows中默认的文件格式是GBK(gb2312),(GBK编码是GB2312编码的超集,向下完全兼容GB2312。)}。解决方法就是把gedit的默认编码改为GB2312。
gconf-editor
然后点开:apps->gedit-2->preferences->encodings
双击encodings中的auto-detected
在弹开的对话框中加入GB2312
再将GB2312移到最上,退出。
3. 用openoffice打开。文件──打开 打开你想要打开的.txt文件,在打开的时候会弹出窗口询问要选择何种字符。如图选择简体中文(GB18030),(GB18030编码向下兼容GBK和GB2312,兼容的含义是不仅字符兼容,而且相同字符的编码也相同。)则打开之后会正常显示了。只是每次都要询问
4. 在Windows上完成从gbk到uft-8的转换,相对于方法1效果要好一些。具体方法如下:
F:\语料库\tc-corpus-train\train>for /r C4-Literature %i in (*.txt) do iconv.exe -f gbk -t utf-8 %i > %~ni.txt
5. 使用enca。
enca可自动判别原文件的编码类型,并且支持通配符,就此能实现批量转换。
enca -L 原文件语言类型 -x 目标编码 原文件名
例如:enca -L zh_CN -x utf-8 file.txt
但是enca会经常遇到转换失败的情况,当然对于不能转换的enca会给出错误报告。
- Ubuntu下打开文件乱码及编码转换
- Ubuntu下打开文件乱码及编码转换
- ubuntu系统下gedit 打开GBK字符集编码文件出现乱码问题解决办法
- ubuntu下打开txt文件乱码问题
- debian下gedit 打开GBK字符集编码文件出现乱码
- ubuntu 下打开windows 文件 程序代码 出现乱码,或者windows打开ubuntu下文件乱码
- Ubuntu 文件编码转换
- Ubuntu下gedit 打开txt文件乱码的处理方法
- 解决ubuntu下打开pdf文件乱码问题
- 解决ubuntu下打开pdf文件乱码问题
- ubuntu下打开txt文件乱码的解决
- ubuntu下打开txt文件乱码的解决
- ubuntu下打开txt文件乱码的解决方法
- Ubuntu 12.04下Gedit打开txt文件乱码解决办法
- ubuntu下打开txt文件乱码的解决
- 双系统中,解决Ubuntu下打开win7中的文件乱码
- ubuntu 12.04下打开txt文件出现乱码的解决方案
- Ubuntu 下打开txt文件乱码的方法
- UDP通信基础(聊天室)
- VC++ CString 及char 指针的常见问题(转)
- 转载自博客园
- IOS 特性CALayer的使用
- SSH框架总结(框架分析+环境搭建+实例源码下载)
- Ubuntu下打开文件乱码及编码转换
- Android使listview(GridView) 获取焦点时,选中上次失去焦点时的item,而不是就近的item
- Android Socket编程所注意的问题
- 专题:Ant-1.7.x
- 编码错误
- 《星搭档》“问题”消失 阿鲁阿卓不再被调侃
- IBM:这五个智能技术的发展,将会改变我们生活
- Mahout的taste里的几种相似度计算方法
- 测序界的第一次