ORACLE中一个字符占多少字节?(中文存储)

来源:互联网 发布:mac视频怎么全屏 编辑:程序博客网 时间:2024/03/29 23:06

问题描述

或许你会说一个中文字符占2个字节,这是一定的?如何计算一个字符串的字节数?

 解决方案

在oracle中一个字符特别是中文占几个字节是不同的。

比如我创立一个表create table test_ly(a varchar2(4),b nvarchar2(4))

你说a列能插入两个汉字吗?

错!最多能插入一个汉字加一个字母(或数字)。

这是为什么?因为一个汉字在a字段中占了3个字节,其他字符(比如数字或者字母或者英文标点符号)占1个字节,

你说b列最多能插入多少个汉字,2个?

错!b列最多能插入4个汉字,b列的一个汉字或者其他字符(比如数字或者字母或者英文标点符号)占2个字节。

 

由此可见,N开头的字段类型(比如NCHAR,NVARCHAR2)中,任何一个字符(包括一个汉字)占2个字节,统一的。

不以N开头的字段类型(比如CHAR,VARCHAR2)中,unicode字符(比如汉字)占3个字节,其他字符占1个字节。

 

如何求一个字符串占用的字符数和字节数?

Length 函数求得是占用字符数,lengthb或者vsize函数求得是占用字节数。

你说 中华12 这个字符串占用了多少字符,字节?看sql返回值便清楚了。

select length('中华12') from dual  --返回4,也就是占用4个字符

select lengthb('中华12') from dual  --返回8,也就是占用8个字节,其中中华儿子各占3个字节,而12两个字符各占一个字节

select lengthb(N'中华1') from dual  --返回6,这是将字符串转换成为unicode字符串后,每个字符占用2个字节,3个就是6个字节

select length(N'中华1') from dual  --返回3,因为只有3个字符嘛。

 

字符串类型字段默认的长度是以字节为单位的,具体取决于参数nls_length_semantics 的值(使用show parameters可以看到这个参数的值),默认是BYTE,也就是以字节为单位的,如果是CHAR则是以字符为单位的。表的某列可以使用字符为单位吗?当然可以,比如这样创建即可:create table test_ly(a varchar2(4 char)) 这样a列就最多能保存4个字符,而不是4个字节了。


2.关于oracle中varchar2与nvarchar2的一点认识

今天在oracle 10g下测试了下varchar2与nvarchar2这两种类型,网上有很多关于这两种类型的区别的帖子,我还是自己测试了下。

varchar2(size type),size最大为4000,type可为char或者byte,默认是byte。

varchar2最多存放4000字节的数据,不管type是char还是byte。所以如果你设置varchar2(4000 char),你可以存入4000个字母,但是不能存入4000个汉字。如果数据库字符集编码是GBK,那么varchar2最多能存放2000个汉字,如果字符集编码是UTF-8,那么则只能最多存放1333个汉字了。

nvarchar2(size),size最大值为2000,单位是字符,而且不管是汉字还是字母,每个字符的长度都是2个字节。所以nvarchar2类型的数据最多能存放2000个汉字,也最多只能存放2000个字母。并且nvarchar2不同于varchar2,他不受数据库字符集的影响。

 

另外如果我们把A1,A2都设为varchar2(4000),并且这两个字段的内容长度都超过了2000字节,那么使用select A1||A2 from table这样的语句时,因为结果超过了4000字节,所以会报错。

3.Oracle的varchar2最多可以存多少个汉字?

如果Oracle 的字符集是Utf-8, varchar2(4000)最多可以存1333个汉字,而varchar2(4000 char)其实和varchar2(1333 char)一样,也是只能存1333个汉字;如果Oracle的字符集是GBK,一个汉字是2个字节的话,varchar2(4000)最多可以存2000个汉字,而varchar2(4000 char)其实和varchar2(2000 char)一样,也是只能存2000个汉字;





0 0
原创粉丝点击