关于数据库中的字段长度

来源:互联网 发布:linux 启动jar包脚本 编辑:程序博客网 时间:2024/06/05 17:46

首先是字节和字符的问题

有些问题看似简单,但如果长时间不用的话就会模糊甚至忘记(可能是基础不太扎实,高手勿喷):

今天上网查找写资料回顾下:

信息一:1个字节等于8个bit位,每个bit位又0/1两种状态也就是说一个字节可以表示256个状态,计算机里用字节来作为最基本的存储单位。一般来说,英文状态下一个字母或数字(称之为字符)占用一个字节,一个汉字用两个字节表示。在不同的编码方式下一个字符占的字节书不太一样。 

字节是计算机存储信息的基本单位。

字符是指计算机中使用的数字和符号,包括:1、2、3、A、B、C、~!·#%……—*()——+等等。1个汉字字符存储需要2个字节,1个英文字符存储需要1个字节。

信息二:字符就是在计算机中使用的字、字母等的统称。 

信息三:字节是存储信息的单位 而所谓字符就是个符号,可以是多种多样的符号


今天找了个沉默已久的帖子,作者做了些测试,觉得很系统就转了下来(作者勿怪):

======================================================================================

大家可能都知道,数据库的varchar字段在保存中文时,字段最大长度和可以保存的字符的最大数量可能是不相等的。

在Oracle中,varchar(100)可以保存50个纯汉字或100个纯字母或者数字。如果希望长度100的varchar保存100个汉字,可以将字段类型设置为nvarchar(这个不太确定,但是oracle确实有这个功能。n表示国际化的意思)

而在db2尤其是as400服务器下的db2,是怎么个情况,今天我们进行了一下测试。下面是测试报告:


                       数据库VARCHAR字段长度设置测试报告
测试时间:2009-01-16 14:00
测试用例:
   数据库表:UserInfo 字段:password varchar(32)

操作记录:
执行SQL:
insert into usrinfo(id,usr_id,password) values('xxxx','xxxx','我使中国热我使中国热我使中国热我'); --失败 16汉字
insert into usrinfo(id,usr_id,password) values('xxxx','xxxx','我使中国热我使中国热我使中国热'); --成功 15汉字
update usrinfo set password='我使中国热我使中国热我使中国热1' where id='xxxx';  --失败 15汉字1数字
update usrinfo set password='我使中国热我使中国热我使中国热a' where id='xxxx';  --失败 15汉字1字母


update usrinfo set password='012345678901234567890123456789' where id='xxxx';    --成功 30数字
update usrinfo set password='01234567890123456789012345678901' where id='xxxx';  --成功 32数字
update usrinfo set password='012345678901234567890123456789我' where id='xxxx';  --失败 30数字1汉字


update usrinfo set password='0123456789我使中国热0123456789' where id='xxxx'; --成功 20数字5汉字 
select length(password) from usrinfo where usr_id='xxxx' ---32 


update usrinfo set password='0我1使2中3国4热' where id='xxxx'; --成功
select length(password) from usrinfo where usr_id='xxxx' ---25


结论:
  1 每个汉字占用2个字符空间
  2 每段汉字再额外占用2个字符空间(可能是辨别标识?)
  3 每个字母或数字占用1个字符空间

----->假设需要保存1000个字(汉字、字母、数字都允许),那么数据库字段最少的长度应该是:
  最极限的情况是:单个汉字和字母(数字)连续间隔出现,即形式如下:
   汉1字2是3好a.......(假设总字符数是x,x是偶数)
  那么汉字个数是x/2,字母数字个数是x/2,为保证该字段的insert和update不报错,字段最少的长度是===>
  x/2*2  汉字占用字符数
  + 
  x/2*1  字母数字占用字符数
  +
  x/2*2  每段汉字占用的标识位数
  =2.5x

  ===================>>>所以,如果需求要求可输入1000个字符,那么数据库保证不出错误的长度应该是2500,而不是我们通常认为的2000!!!

======================================================================================================

以备以后查询



原创粉丝点击