SQLite3数据类型

来源：互联网发布：centos安装oracle 编辑：程序博客网时间：2024/06/05 21:58

NULL

INTEGER

REAL

TEXT

BLOB

但实际上，sqlite3也接受如下的数据类型：

smallint 16 位元的整数。

interger 32 位元的整数。

decimal(p,s) p 精确值和 s大小的十进位整数，精确值p是指全部有几个数(digits)大小值，s是指小数点後有几位数。如果没有特别指定，则系统会设为 p=5; s=0 。

float 32位元的实数。

double 64位元的实数。

char(n) n 长度的字串，n不能超过 254。

varchar(n) 长度不固定且其最大长度为 n的字串，n不能超过 4000。

graphic(n) 和 char(n)一样，不过其单位是两个字元 double-bytes， n不能超过127。这个形态是为了支援两个字元长度的字体，例如中文字。

vargraphic(n) 可变长度且其最大长度为 n的双字元字串，n不能超过 2000

date 包含了年份、月份、日期。

time 包含了小时、分钟、秒。

timestamp 包含了年、月、日、时、分、秒、千分之一秒。

1.存储类别

第二版把所有列的值都存储成ASCII文本格式。第三版则可以把数据存储成整数和实数,还可以存储BLOB数据.

Each value stored in an SQLite数据库中存储的每个值都有一个属性,都属于下面所列类中的一种,(被数据库引擎所控制)

空.这个值为空值

整数.值被标识为整数,依据值的大小可以依次被存储为1,2,3,4,5,6,7,8.

实数.所有值都是浮动的数值,被存储为8字节的IEEE浮动标记序号.

文本.值为文本字符串,使用数据库编码存储(TUTF-8, UTF-16BE or UTF-16-LE).

BLOB. 值是BLOB数据,如何输入就如何存储,不改变格式.

像SQLite2.0版一样,在3.0版中,除了INTEGER PRIMARY KEY,数据库中的任何列都可以存储任何类型的数据.这一规则也有例外,在下面的"严格相似模式"中将描述.

输入SQLite的所有值,不管它是嵌入 SQL语句中的文字还是提前编译好的绑定在SQL语句中的值,在SQL语句执行前都被存储为一个类.在下面所描述的情况下,数据库引擎将在执行时检查并把值在数字存储类(整数和实数)和文本类间转换.

存储的类别最初被分类为如下:

具体的值比如SQL语句部分的带双引号或单引号的文字被定义为文本,如果文字没带引号并没有小数点或指数则被定义为整数,如果文字没带引号但有小数点或指数则被定义为实数,如果值是空则被定义为空值.BLOB数据使用符号X'ABCD'来标识.

Values supplied using the被输入的值使用sqlite3_bind_* APIs的被分类一个存储等级,这等级是和原来的类基本相一致的. (比如sqlite3_bind_blob()绑定一个BLOB的值).

值的分类是SQL分等级操作的结果,决定于最远的操作表达式.用户定义的功能也许会把值返回任意的类.在编译的时候来确定表达式的存储类基本是不可能的.

2. 列之间的亲和性

在SQLite3.0版中,值被定义为什么类型只和值自身有关,和列没有关系,和变量也没有关系. (这有时被称作弱类型.)所有其它的我们所使用的数据库引擎都受静态类型系统的限制,其中的所有值的类是由其所属列的属性决定的,而和值无关.

为了最大限度的增加SQLite数据库和其他数据库的兼容性,SQLite支持列的"类型亲和性".列的亲和性是为该列所存储的数据建议一个类型.我们要注意是建议而不是强迫.在理论上来讲,任何列依然是可以存储任何类型的数据的.只是针对某些列,如果给建议类型的话,数据库将按所建议的类型存储.这个被优先使用的数据类型则被称为"亲和类型".

在SQLite3.0版中,数据库中的每一列都被定义为以下亲和类型中的一种:

文本

数字的

整数

无

一个具有类型亲和性的列按照无类型,文本,或BLOB存储所有的数据.如果数字数据被插入一个具有文本类型亲和性的列,在存储之前数字将被转换成文本.

一个具有数字类型亲和性的列也许使用所有的五个存储类型存储值.当文本数据被插入一个数字列时,在存储之前,数据库将尝试着把文本转换成整数或实数.如果能成功转换的话,值将按证书活实数的类型被存储.如果不能成功转换的话,值则只能按文本类型存储了,而不会被转换成无类型或BLOB类型来存储.

一个具有整数亲和力的列在转换方面和具有数字亲和力的列是一样的,但也有些区别 ,比如没有浮动量的实值(文本值转换的值)被插入具有整数亲和力的列时,它将被转换成整数并按整数类型存储.

一个具有无类型亲和力的列不会优先选择使用哪个类型.在数据被输入前它不会强迫数据转换类型.

2.1 列的亲和性的决定

一个列的亲和类型是由该列所宣称的类型决定的.遵守以下规则:

如果数据类型包括字符串"INT"那么它被定义成具有整数亲和性.

如果列中的数据类型包括以下任何的字符串 "CHAR", "CLOB", or"TEXT"那么这个列则具有文本亲和性.要注意VARCHAR类型包括字符串"CHAR"因此也具有文本类型亲和性.

如果一个列的数据类型包括字符串"BLOB"或者如果数据类型被具体化了,那么这个列具有无类型亲和性.

否则就具有数字类型亲和性.

如果表格使用If "CREATE TABLE AS SELECT..."语句生成的,那么所有的列则都没有具体的数据类型,则没有类型亲和性.

2.2 列的亲和性的例子

CREATE TABLE t1(

t TEXT,

nu NUMERIC,

i INTEGER,

no BLOB

);

-- Storage classes for the followingrow:

-- TEXT, REAL, INTEGER, TEXT

INSERT INTO t1 VALUES('500.0', '500.0','500.0', '500.0');

-- Storage classes for the followingrow:

-- TEXT, REAL, INTEGER, REAL

INSERT INTO t1 VALUES(500.0, 500.0,500.0, 500.0);

3.比较表达式

像SQLite2.0版一样,3.0版的一个特性是二进制比较符'=', '<', '<=', '>=' and '!=',一个操作'IN'可以测试固定的成员资格,三重的比较操作符'BETWEEN'.

比较的结果决定于被比较的两个值的存储类型。遵循以下规则：

一个具有空存储类型的值被认为小于任何值（包括另外一个具有空存储类型的值）。

一个整数值或实数值小于任何文本值和BLOB值。当一个整数或实数和另一个整数或实数相比较的时候，则按照实际数值来比较。

一个文本值小于BLOB值。当两个文本值相比较的时候，则用C语言类库中的memcmp()函数来比较。然而，有时候也不是这样的，比如在下面所描述的“用户定义的整理顺序”情况下。

当两个BLOB文本被比较的时候，结果决定于memcmp()函数。

在开始比较前，SQLite尝试着把值在数字存储级（整数和实数）和文本之间相互转换。下面列举了关于如何比较二进制值的例子。在着重号below中使用的表达式可以表示SQL标量表达式或是文本但不是一个列值。

当一个列值被比拟为表达式结果的时候，在比较开始前，列的亲和性将被应用在表达结果中。

当两个列值比较的时候，如果一个列有整数或数字亲和性的时候，而另外一列却没有，那么数字亲和性适用于从非数字列提取的任何具有文本存储类型的值. P>

当比较两个表达式的结果时,不发生任何转换,直接比较结果.如果一个字符串和一个数字比较,数字总是小于字符串.

在SQLite中,表达式"a BETWEEN b AND c"等于表达式 "a >= b AND a <= c",在比较表达式时,a可以是具有任何亲和性.

表达式 "a IN (SELECT b ....)"在比较时遵循上面所提到的三条规则,是二进制比较.(例如,在一个相似的样式 "a = b").例如,如果'b'是一个列值, 'a' 是一个表达式,那么,在开始比较前,'b'的亲和性就被转换为'a'的亲和性了.

SQLite把表达式 "a IN (x, y, z)"和 "a = z OR a = y OR a = z"视为相等.

3.1 比较例子

CREATE TABLE t1(

a TEXT,

b NUMERIC,

c BLOB

);

-- Storage classes for the followingrow:

-- TEXT, REAL, TEXT

INSERT INTO t1 VALUES('500', '500','500');

-- 60 and 40 are converted to '60' and'40' and values are compared as TEXT.

SELECT a < 60, a < 40 FROMt1;

1|0

-- Comparisons are numeric. Noconversions are required.

SELECT b < 60, b < 600 FROMt1;

0|1

-- Both 60 and 600 (storage classNUMERIC) are less than '500'

-- (storage class TEXT).

SELECT c < 60, c < 600 FROMt1;

0|0

4. 运算符

所有的数学运算符(所有的运算符而不是连锁作用标记符"||")运算对象首先具有数字亲和性,如果一个或是两个都不能被转换为数字那么操作的结果将是空值。

对于连接作用操作符，所有操作符将首先具有文本亲和性。如果其中任何一个操作符不能被转换为文本（因为它是空值或是BLOB）连接作用操作符将是空值。

5. 分类，排序，混合挑选

当用子句ORDER挑选值时，空值首先被挑选出来,然后是整数和实数按顺序被挑选出来,然后是文本值按memcmp()顺序被挑选出来,最后是BLOB值按memcmp()顺序被挑选出来.在挑选之前,没有存储类型的值都被转换了.

When grouping values with the当用GROUP BY子句给值分组时,具有不同存储类型的值被认为是不同的,但也有例外,比如,一个整数值和一个实数值从数字角度来说是相等的,那么它们则是相等的.用GROUP by 子句比较完后,值不具有任何亲和性.

混合挑选操作符UNION, INTERSECT and EXCEPT在值之间实行绝对的比较,同样的亲和性将被应用于所有的值,这些值将被存储在一个单独的具有混合SELECT的结果组的列中.被赋予的亲和性是该列的亲和性,这个亲和性是由剩下的大部分的混合SELECTS返回的,这些混合SELECTS在那个位置上有列值(而不是其它类型的表达式).如果一个给定的混合SELECT列没有SELECTS的量,那么在比较前,该列的值将不具有任何亲和性.

6. 其它亲和性模式

以上的部分所描述的都是数据库引擎在正常亲和性模式下所进行的操作, SQLite将描述其它两种亲和性模式,如下:

严格亲和性模式.在这种模式下,如果需要值之间相互转换数据存储类型的话,数据库引擎将发送错误报告,当前语句也将会重新运行.

无亲和性模式.在这种模式下,值的数据存储类型不发生转换.具有不同存储类型的值之间不能比较,但整数和实数之间可以比较.

7.用户定义的校对顺序

By default, when 当SQLite比较两个文本值的时候,通过系统设定,不管字符串的编码是什么,用memcmp()来比较. SQLite第三版允许用户提供任意的函数来代替memcmp(),也就是用户定义的比较顺序.

除了系统预设的BINARY比较顺序,它是用memcmp()函数比较,SQLite还包含了两个额外的内置比较顺序函数, NOCASE和REVERSE:

BINARY -使用memcmp()比较字符串数据,不考虑文本编码.

REVERSE -用倒序比较二进制文本.

NOCASE - 和二进制一样,但在比较之前,26位的大写字母盘要被折合成相应的小写字母盘.

7.1 分配比较顺序

每个表格中的每个列都有一个预设的比较类型.如果一个比较类型不是二进制所要求的,比较的子句将被具体化为列的定义来定义该列.

当用SQLite比较两个文本值时,比较顺序将按照以下的规则来决定比较的结果.文档的第三部分和第五部分描述在何种场合下发生这种比较.

对于二进制比较符(=, <, >, <= and >=),如果每个操作数是一列的话,那么该列的默认比较类型决定于所使用的比较顺序.如果两个操作数都是列的话,那么左边的操作数的比较类型决定了所要使用的比较顺序.如果两个操作数都不是一列,将使用二进制来比较.

表达式"x BETWEEN y and z"和 "x >= y AND x <= z"是相同的.表达式"x IN (SELECT y ...)"和表达式 "x = y"使用同样的方法来操作,这是为了决定所要使用的比较顺序.如果X是一列或者二进制的,则"x IN (y, z ...)" 形式的表达式所使用的比较顺序是X的默认的比较类型.

ORDER BY clause that is part of a SELECTstatement may be assigned a collation sequence to be used for the sortoperation explicitly. In this case the explicit collation sequence is alwaysused. Otherwise, if the expression sorted by an ORDER BY clause is a column,then the default collation type of the column is used to determine sort order.If the expression is not a column, then the BINARY collation sequence is used.

7.2 比较顺序的例子

下面的例子介绍了The examples below identify thecollation sequences that would be used to determine the results of textcomparisons that may be performed by various SQL statements. Note that a textcomparison may not be required, and no collation sequence used, in the case ofnumeric, blob or NULL values.

CREATE TABLE t1(

a, -- default collation type BINARY

b COLLATE BINARY, --default collation type BINARY

c COLLATE REVERSE, --default collation type REVERSE

d COLLATENOCASE -- default collation type NOCASE

);

-- Text comparison is performed usingthe BINARY collation sequence.

SELECT (a = b) FROM t1;

-- Text comparison is performed usingthe NOCASE collation sequence.

SELECT (d = a) FROM t1;

-- Text comparison is performed usingthe BINARY collation sequence.

SELECT (a = d) FROM t1;

-- Text comparison is performed usingthe REVERSE collation sequence.

SELECT ('abc' = c) FROM t1;

-- Text comparison is performed usingthe REVERSE collation sequence.

SELECT (c = 'abc') FROM t1;

-- Grouping is performed using theNOCASE collation sequence (i.e. values

-- 'abc' and 'ABC' are placed in thesame group).

SELECT count(*) GROUP BY d FROM t1;

-- Grouping is performed using theBINARY collation sequence.

SELECT count(*) GROUP BY (d || '') FROMt1;

-- Sorting is performed using theREVERSE collation sequence.

SELECT * FROM t1 ORDER BY c;

-- Sorting is performed using the BINARYcollation sequence.

SELECT * FROM t1 ORDER BY (c || '');

-- Sorting is performed using the NOCASEcollation sequence.

SELECT * FROM t1 ORDER BY c COLLATE NOCASE;

SQLite驱动支持的SQL列类型

类型

描述

TINYBLOB, BLOB, MEDIUMBLOB, LONGBLOB, BYTEA

不限制长度的字符串类型.二进制数据必须安全地编码存储,见text类型.

CHAR(), VARCHAR(), TINYTEXT, TEXT, MEDIUMTEXT, LONGTEXT

不限制长度的字符串类型.不会被截断或者填充

ENUM

不限制长度的字符串类型.不像 MySQL, 使用 ENUM代替 VARCHAR不会节省存储空间.

SET

不限制长度的字符串类型. In contrast to MySQL, the input is not checked against the list of allowed values.

YEAR

不限制长度的字符串类型. MySQL用1个字节存储 2个或者 4 个数字年份, 而SQLite存为一个字符串.

TINYINT, INT1, CHAR

A 1 byte type used to store one character, a signed integer between -128 and 127, or an unsigned integer between 0 and 255.

SMALLINT, INT2

2 byte (short) integer type used to store a signed integer between -32768 and 32767 or an unsigned integer between 0 and 65535.

MEDIUMINT

3 byte integer type used to store a signed integer between -8388608 and 8388607 or an unsigned integer between 0 and 16777215.

INT, INTEGER, INT4

4字节 (long)整数类型,用来存储一个有符号的整数,范围从-2147483648到 2147483647,或者一个有符号的整数,范围从 0到
4294967295.

BIGINT, INT8, INTEGER PRIMARY KEY

8 字节 (long long)整型,用来存储有符号的整数,从
-9223372036854775808 到 9223372036854775807 ,或者无符号的整数,从0到 18446744073709551615. 请看下面关于
INTEGER PRIMARY KEY的讨论(哈哈,rowid就是8个字节的整数)

DECIMAL, NUMERIC

A string type of unlimited length used to store floating-point numbers of arbitrary precision.

TIMESTAMP, DATETIME

用来存储日期/时间的不限制长度的字符串类型.
要求的格式是 ‘YYYY-MM-DD HH:MM:SS’,其他的东西被忽略.

DATE

用来存储日期的不限制长度的字符串类型.要求的格式是
‘YYYY-MM-DD’, 别的格式的东西会被忽略.

TIME

用来存储时间的不限制长度的字符串类型.要求的格式是 ‘HH:MM:SS’,其他格式的东西会被忽略.

FLOAT, FLOAT4, REAL

A
4 byte floating-point number. The range is -3.402823466E+38 to
-1.175494351E-38, 0, and 1.175494351E-38 to 3.402823466E+38. Please
note that MySQL treats REAL as an 8 byte instead of a 4 byte float like
PostgreSQL.

DOUBLE, DOUBLE PRECISION, FLOAT8

An
8 byte floating-point number. The range is -1.7976931348623157E+308 to
-2.2250738585072014E-308, 0, and 2.2250738585072014E-308 to
1.7976931348623157E+308.

备注：
1、CHAR。CHAR存储定长数据很方便，CHAR字段上的索引效率级高，比如定义char(10)，那么不论你存储的数据是否达到了10个字节，都要占去10个字节的空间,不足的自动用空格填充。

2、VARCHAR。存储变长数据，但存储效率没有CHAR高。如果一个字段可能的值是不固定长度的，我们只知道它不可能超过10个字符，把它定义为 VARCHAR(10)是最合算的。VARCHAR类型的实际长度是它的值的实际长度+1。为什么“+1”呢？这一个字节用于保存实际使用了多大的长度。从空间上考虑，用varchar合适；从效率上考虑，用char合适，关键是根据实际情况找到权衡点。

3、TEXT。text存储可变长度的非Unicode数据，最大长度为2^31-1(2,147,483,647)个字符。

4、NCHAR、NVARCHAR、NTEXT。这三种从名字上看比前面三种多了个“N”。它表示存储的是Unicode数据类型的字符。我们知道字符中，英文字符只需要一个字节存储就足够了，但汉字众多，需要两个字节存储，英文与汉字同时存在时容易造成混乱，Unicode字符集就是为了解决字符集这种不兼容的问题而产生的，它所有的字符都用两个字节表示，即英文字符也是用两个字节表示。nchar、nvarchar的长度是在1到4000之间。和 char、varchar比较起来，nchar、nvarchar则最多存储4000个字符，不论是英文还是汉字；而char、varchar最多能存储 8000个英文，4000个汉字。可以看出使用nchar、nvarchar数据类型时不用担心输入的字符是英文还是汉字，较为方便，但在存储英文时数量上有些损失。

所以一般来说，如果含有中文字符，用nchar/nvarchar，如果纯英文和数字，用char/varchar。