Oracle 字符类型整理

来源:互联网 发布:淘宝传图片教程视频 编辑:程序博客网 时间:2024/06/08 17:22
1、Char
定长格式字符串,在数据库中存储时不足位数填补空格,它的声明方式如下CHAR(L),L为字符串长度,缺省为1,最大为2000。不建议使用,会带来不必要的麻烦。
a、字符串比较的时候,如果不注意(char不足位补空格)会带来错误
b、字符串比较的时候,如果用trim函数,这样该字段上的索引就失效(有时候会带来严重性能问题)
c、浪费存储空间(无法精准计算未来存储大小,只能留有足够的空间;字符串的长度就是其所占用空间的大小)
d、char的效率比varchar2的效率稍高。

2、Varchar2/varchar
目前VARCHAR是VARCHAR2的同义词。工业标准的VARCHAR类型可以存储空字符串,但是oracle不这样做,尽管它保留以后这样做的权利。Oracle自己开发了一个数据类型VARCHAR2,这个类型不是一个标准的VARCHAR,它将在数据库中varchar列可以存储空字符串的特性改为存储NULL值。如果你想有向后兼容的能力,Oracle建议使用VARCHAR2而不是VARCHAR。
不定长格式字符串,它的声明方式如下VARCHAR2(L),L为字符串长度,没有缺省值,最大为4000。在多字节语言环境中,实际存储的字符个数可能小于L值,例如:当语言
环境为中文(SIMPLIFIED CHINESE_CHINA.ZHS16GBK)时,一个VARCHAR2(200)的数据列可以保存200个英文字符或者100个汉字字符;对于4000字节以内的字符串,建议都用该类型

a。VARCHAR2比CHAR节省空间,在效率上比CHAR会稍微差一些,即要想获得效率,就必须牺牲一定的空间,这也就是我们在数据库设计上常说的‘以空间换效率’。
b。VARCHAR2虽然比CHAR节省空间,但是如果一个VARCHAR2列经常被修改,而且每次被修改的数据的长度不同,这会引起‘行迁移’(Row Migration)现象,而这造成多余的I/O,是数据库设计和调整中要尽力避免的,在这种情况下用CHAR代替VARCHAR2会更好一些。不过区别也不是太大,如果就是想用varchar2,那么在发生行迁移,可以通过pctfree来调整,然后对表的数据进行重组

nchar,nvarchar/nvarchar2国家字符集,与环境变量NLS指定的语言集密切相关。只有要用到unicode时才会用到这些国家字符集,nchar和nvarchar2依据所选的字符集来存储数据,可能一个字符占两个或多个字节,防止乱码

3. 行
包括RAW和LONG RAW两种类型,用来存储二进制数据,不会在字符集间转换
RAW,类似于CHAR,声明方式RAW(L),L为长度,以字节为单位,作为数据库列最大2000,作为变量最大32767字节。
LONG RAW,类似于LONG,作为数据库列最大存储2G字节的数据,作为变量最大32760字节。
行标识,只有一种类型--ROWID,用来存储“行标识符”,可以利用ROWIDTOCHAR函数来将行标识转换成为字符。


4、Date
Date类型是一个7字节的定长数据类型(从世纪到秒),绝对没有“千年虫”问题。
举个例子:性能a>b>c
a、SQL> ...Where date_colum>=to_date(’01-jan-2007’,’dd-mon-yyyy’)
     and date_colum< to_date(’02-jan-2007’,’dd-mon-yyyy’)
b、SQL> ...Where trunc(date_colum,’y’)=to_date(’01-jan-2007’,’dd-mon-yyyy’)
c、SQL> ...Where to_char(date_colum,’yyyy’)=’2007’

5、 Timestamp
ORACLE已经在DATE数据类型上扩展出来了TIMESTAMP数据类型,它包括了所有DATE数据类型的年月日时分秒的信息,而且包括了小数秒的信息。如果你想把DATE类型转换成TIMESTAMP类型,就使用CAST 函数
语法Timestamp(n),n指定秒的小数位数,取值范围0~9。缺省是6。

SQL> select to_char(systimestamp,'yyyy-mm-dd hh24:mi:ss.ff8') from dual;

TO_CHAR(SYSTIMESTAMP,'YYYY-MM-
------------------------------
2012-08-11 10:34:48.89800000
这是因为显示格式是按照参数NLS_TIMESTAMP_FORMAT定的缺省格式显示。

说明:
1)当你把一个表中date类型字段的数据移到另一个表的timestamp类型字段中去的时候,可以直接写INSERT SELECT语句, oracle会自动为你做转换的。
2) to_char函数支持date和timestamp,但是trunc却不支持TIMESTAMP数据类型

a。把DATE类型转换成TIMESTAMP类型
SQL> select cast(sysdate as timestamp) from dual;

CAST(SYSDATEASTIMESTAMP)
--------------------------------------------------------------------------------
11-8月 -12 10.35.40.000000 上午
正如你看到的,在转换后的时间段尾部有了一段“.000000”。这是因为从date转换过来的时候,没有小数秒的信息,缺省为0

b. 为了得到系统时间,返回成date数据类型。你可以使用sysdate函数。
SQL> select sysdate from dual;

SYSDATE
-----------
2012/8/11 1

c. 为了得到系统时间,返回成timestamp数据类型。你可以使用systimpstamp函数。
SQL> select systimestamp from dual;

SYSTIMESTAMP
--------------------------------------------------------------------------------
11-8月 -12 10.38.16.809000 上午 +08:00

d. 你可以设置初始化参数FIXED_DATE指定sysdate函数返回一个固定值。这用在测试日期和时间敏感的代码。注意,这个参数对于systimestamp函数无效。
SQL> alter system set fixed_date ='2006-01-01-10:00:00';
System altered


SQL> select sysdate from dual;
SYSDATE
-----------
2006-1-1 10

SQL> select systimestamp from dual;
SYSTIMESTAMP
--------------------------------------------------------------------------------
11-8月 -12 10.38.16.809000 上午 +08:00

e. 参数fixed_date恢复默认值
SQL> alter system set fixed_date=none;
System altered

SQL> select sysdate from dual;
SYSDATE
-----------
2012/8/11 1

6. Number
定义Number的方法:Number(p,s) ;其中p,s都是可选的:
p代表精度,默认为38
s代表小数位数,取值范围-84~127,默认取值要看是否指定了p,如果制定了p,默认s为0,如果没有指定p,默认取最大值。

几个例子:
a、 Number(5,0)=Number(5) 取值范围99999~-99999
b、 Number(5,2) 取值范围999.99~-999.99
注意:其中的整数位数只有3位,小数位数有2位,按照如下方法计算:
整数位数<=p-s
小数位数<=s
如果插入123.555存储在数据库中变成123.56 (在小数的第三位上四舍五入),如果插入999.999,数据库就要抛错。
c、 Number(5,-2) 取值范围9999900~-9999900 (整数位数<=p-s,没有小数位数)
如果插入9999949存储在数据库中变成9999900(在整数的第二位上四舍五入),如果插入9999950,数据库就要抛错。
其他的数值类型都是number的衍生,底层都是number,比如integer/int完全映射到number(38)
性能相关:number是一种软实现的类型,如果需要对number做复杂的运算,建议先用cast内置函数转换number为浮点数类型
另外需要注意的一点是:number是变长类型,在计算表存储空间的时候要切记

7. Lob
Clob/blob实现是比较复杂的,主要是用来存储大量数据的数据库字段,最大可以存储4G字节的非结构化数据。
Oracle的Blob字段比较特殊,他比long 字段的性能要好很多,可以用来保存例如图片之类的二进制数据。
写入Blob字段和写入其它类型字段的方式非常不同,因为Blob自身有一个cursor,你必须使用cursor对blob进行操作,因而你在写入Blob之前,必须获得cursor才能进行写入,那么如何获得Blob的cursor呢?这需要你先插入一个empty的blob,这将创建一个blob的cursor,然后你再把这个empty的blob的cursor用select查询出来,这样通过两步操作,你就获得了blob的cursor,可以真正的写入blob数据了。

这里只提几个和性能相关的点,当然能不用lob尽量不用:
oralce中有四种类型的lob:clob,blob,nclob,bfile.
clob:内部字符大对象;
blob:内部二进制大对象;
nclob:内部定长多字节大对象;
bfile:外部二进制大文件,这个文件中的数据只能被只读访问,并且不包含在数据库内;bfile是早期的RDBMS BLOB的直接继承,作为数据库指针存储在数据库内部,指向外部的操作系统文件.

 a,按存储方式分: 
     内部LOB:存放在DB内部,包括BLOB,CLOB,BCLOB  
     外部文件:存放在DB外面,就是BFILE 
 b.按存储数据的类型分:
  ①字符类型:
   CLOB:存储大量 单字节 字符数据。
   NLOB:存储定宽 多字节 字符数据。
  ②二进制类型:
   BLOB:存储较大无结构的二进制数据。
  ③二进制文件类型:
   BFILE:将二进制文件存储在数据库外部的操作系统文件中。存放文件路径。

关于使用LOB数据类型的性能问题
a、 一个lob字段包括lobindex和lobsegment,LOB INDEX是隐式创建的
b、 Lob缺省可以存放在表中(表字段),条件是:
1.它的大小小于4kb
2.并且在定义的时候没有使用(disable storage inrow)字句(缺省是enable)
当lob大于4kb的时候它会被存放到lobsegment中
c、当lob存放在表中的时候,它可以被缓存,对于它的操作效率远远高于存储在lobsegment中的lob(不用lobindex)
d、 存储在lobsegment中的lob缺省不在缓冲区缓存,对于lob的读写都是物理IO,代价非常高,所以对于大于4kb的lob字段千万不要频繁更新,效率非常低
e、 存储在lobsegment中的lob可以在定义的时候指定使用cache(默认是nocache),这对于中等大小的lob(比如几k~几十k)很有用处,同时,它还可以减少物理IO。
原创粉丝点击