如何用SQLLDR导入unicode格式文件到数据库

来源:互联网 发布:军人严防手机网络泄密 编辑:程序博客网 时间:2024/05/22 12:56

要把unicode格式(其中有UTF16编码与UTF8编码的)的文件导入数据庫,除了在control文件中设定一般
的参数之外,另外还要加入下面两个参数。

CHARACTERSET : 它指明你的导入文件是什么格式的,可以是UTF16,UTF8. 如果这里指定的编码方式与你
导入的文件不相符导入会出错。
例如: CHARACTERSET 'UTF16'

LENGTH : 此参数是接着放在CHARACTERSET参数之后的,Oracle字符字段的长度可以是BYTE或CHARACTER,
如果你的导入文件是多字节字符集的,此参数要设定为CHARACTER,否则在导入时会因长度不够会被reject.
LENGTH CHARACTER

另外对于UTF16的文件,SQLLDR默认是CHARACTER,所以在control文件里不设定也不会有问题,对于文件开头
带Unicode Signature (BOM -Byte Order)Mark的,SQLLDR也是可以正确处理的.


CONTROL文件1

LOAD DATA
CHARACTERSET 'UTF16'
BADFILE 'sample.bad'
DISCARDFILE 'sample.dsc'
REPLACE
INTO TABLE "COUNTRIES"
fields terminated by '/t'
(
LOCATION CHAR(20),
CNTRY_REF CHAR(20),
CNTRY_ISO_CODE CHAR(10),
CNTRY_DESC CHAR(100),
LANG_CODE CHAR(20),
SOURCE CHAR(50),
SOURCE_STATUS CHAR(20),
SOURCE_SYSTEM CHAR(20)
)

CONTROL文件2

LOAD DATA
CHARACTERSET 'UTF8'
LENGTH CHARACTER
BADFILE 'sample.bad'
DISCARDFILE 'sample.dsc'
REPLACE
INTO TABLE "COUNTRIES"
fields terminated by '/t'
(
LOCATION CHAR(20),
CNTRY_REF CHAR(20),
CNTRY_ISO_CODE CHAR(10),
CNTRY_DESC CHAR(100),
LANG_CODE CHAR(20),
SOURCE CHAR(50),
SOURCE_STATUS CHAR(20),
SOURCE_SYSTEM CHAR(20)
)

原创粉丝点击