《经典精彩Lib翻译》系列之libiconv (2)ICONV程序

来源:互联网 发布:巨人网络校园招聘2017 编辑:程序博客网 时间:2024/04/28 14:08

ICONV程序

翻译:兵不厌库

like.lib@gmail.com

11/21/2007

 

查看原文

http://www.gnu.org/software/libiconv/documentation/libiconv/iconv.1.html


名称

iconv – 字符集转换

纲要

iconv [OPTION。。。] [-f encoding] [-t encoding] [inputfile 。。。]

iconv -l

描述

iconv程序将文本从一种编码转换到另一种编码。

更精确地,用选项-f指定源编码方式,选项-t指定目的编码方式。源/目的编码方式默认时,为当前本地的编码方式。

iconv程序依次读取并转换选项inputfiles给定的文件;如果没有给定inputfiles,它将使用标准输入,转换后的文件打印在标准输出上。

 

哪些编码能够实现依赖于系统的,它们列在iconv_open(3) 手册上(manual page)。

 

输入输出控制选项:

-f encoding--from-code=encoding

指定输入的编码。

-t encoding--to-code=encoding

    指定输出的编码。

控制转换问题选项:

    -c

    当该选项被指定时,无法转换的字符将被忽略,而不会导致转换程序出错。

 

--unicode-subst=formatstring

    当该选项被指定时,目标编码不能显示的Unicode字符由formatstring格式串构造的占位符代替,applied to the Unicode code pointformatstring的格式必须与printf命令和printf()函数是相同的,可以不带参数,也可以带一个无符号整数参数。

--byte-subst=formatstring

    当该选项被指定时,输入的在源编码中无效的字节由formatstring格式串构造的占位符代替,applied to the byte's valueformatstring的格式必须与printf命令和printf()函数是相同的,可以不带参数,也可以带一个无符号整数参数。

--widechar-subst=formatstring

    当该选项被指定时,输入的在源编码中无效的宽字符由formatstring格式串构造的占位符代替,applied to the byte's valueformatstring的格式必须与printf命令和printf()函数是相同的,可以不带参数,也可以带一个无符号整数参数。

 

控制错误输出的选项:

-s --silent

    当该选项被指定时,关于无效字符或不能转换字符的错误信息被忽略,但是,转换后的文件是没有改变的。

 

iconv -l iconv --list 命令列出了iconv支持的编码名称,名称格式依赖于本地系统。根据libiconv实现,编码名称为大写并用空格隔开。一种编码的别名显示在同一行。

示例

iconv -f ISO-8859-1 -t UTF-8

将输入的文本从西欧编码ISO-8859-1转换到Unicode

 

iconv -f KOI8-R --byte-subst="<0x%x>"

                --unicode-subst="<U+%04X>"

将输入的文本从俄语编码KOI8-R转换到本地编码,同时,无效字节或有效但无法转换的字符用“尖括号+16进制数字”替换。

 

conv –list

列出所有支持的编码。

查看相关

 

iconv_open(3)locale(7)