sqlite字段类型

来源:互联网 发布:java rmi 漏洞利用 编辑:程序博客网 时间:2024/05/15 08:09

改了点东西,因为想着要把项目优化,但是每条数据如果都存到单一数据库中,会造成以后的数据越来越大,怎么办?于是我想到了,可以考虑将单类数据存储到sqlite中,既可以备份,又可以用作缓存和其他作用。

所以就想到了sqlite的一些特性,当然,花了大量的时间测试代码,即,一份代码自动生成不同的数据库,可以自由控制读取哪个库哪个表。基于YII而已。写的有点挫,但现在这样的好处是可以不改动原有任何一行代码。

OK,接着转sqlite的字段类型。

一、存储种类和数据类型:

    SQLite将数据值的存储划分为以下几种存储类型:
     NULL: 表示该值为NULL值。
     INTEGER: 无符号整型值。
     REAL: 浮点值。
     TEXT: 文本字符串,存储使用的编码方式为UTF-8、UTF-16BE、UTF-16LE。
     BLOB: 存储Blob数据,该类型数据和输入数据完全相同。
    由于SQLite采用的是动态数据类型,而其他传统的关系型数据库使用的是静态数据类型,即字段可以存储的数据类型是在表声明时即以确定的,因此它们之间 在数据存储方面还是存在着很大的差异。在SQLite中,存储分类和数据类型也有一定的差别,如INTEGER存储类别可以包含6种不同长度的 Integer数据类型,然而这些INTEGER数据一旦被读入到内存后,SQLite会将其全部视为占用8个字节无符号整型。因此对于SQLite而 言,即使在表声明中明确了字段类型,我们仍然可以在该字段中存储其它类型的数据。然而需要特别说明的是,尽管SQLite为我们提供了这种方便,但是一旦 考虑到数据库平台的可移植性问题,我们在实际的开发中还是应该尽可能的保证数据类型的存储和声明的一致性。除非你有极为充分的理由,同时又不再考虑数据库 平台的移植问题,在此种情况下确实可以使用SQLite提供的此种特征。
   1. 布尔数据类型:
    SQLite并没有提供专门的布尔存储类型,取而代之的是存储整型1表示true,0表示false。

   2. 日期和时间数据类型:
    和布尔类型一样,SQLite也同样没有提供专门的日期时间存储类型,而是以TEXT、REAL和INTEGER类型分别不同的格式表示该类型,如:
    TEXT: "YYYY-MM-DD HH:MM:SS.SSS"
    REAL: 以Julian日期格式存储
    INTEGER: 以Unix时间形式保存数据值,即从1970-01-01 00:00:00到当前时间所流经的秒数。

二、类型亲缘性:

    为了最大化SQLite和其它数据库引擎之间的数据类型兼容性,SQLite提出了"类型亲缘性(Type Affinity)"的概念。我们可以这样理解"类型亲缘性 ",在表字段被声明之后,SQLite都会根据该字段声明时的类型为其选择一种亲缘类型,当数据插入时,该字段的数据将会优先采用亲缘类型作为该值的存储 方式,除非亲缘类型不匹配或无法转换当前数据到该亲缘类型,这样SQLite才会考虑其它更适合该值的类型存储该值。SQLite目前的版本支持以下五种 亲缘类型:

亲缘类型描述  TEXT数值型数据在被插入之前,需要先被转换为文本格式,之后再插入到目标字段中。NUMERIC当文本数据被插入到亲缘性为NUMERIC的 字段中时,如果转换操作不会导致数据信息丢失以及完全可逆,那么SQLite就会将该文本数据转换为INTEGER或REAL类型的数据,如果转换失 败,SQLite仍会以TEXT方式存储该数据。对于NULL或BLOB类型的新数据,SQLite将不做任何转换,直接以NULL或BLOB的方式存储 该数据。需要额外说明的是,对于浮点格式的常量文本,如"30000.0",如果该值可以转换为INTEGER同时又不会丢失数值信息,那么SQLite 就会将其转换为INTEGER的存储方式。INTEGER对于亲缘类型为INTEGER的字段,其规则等同于NUMERIC,唯一差别是在执行CAST表达式时。REAL其规则基本等同于NUMERIC,唯一的差别是不会将"30000.0"这样的文本数据转换为INTEGER存储方式。NONE不做任何的转换,直接以该数据所属的数据类型进行存储。  

   1. 决定字段亲缘性的规则:
    字段的亲缘性是根据该字段在声明时被定义的类型来决定的,具体的规则可以参照以下列表。需要注意的是以下列表的顺序,即如果某一字段类型同时符合两种亲缘性,那么排在前面的规则将先产生作用。
    1). 如果类型字符串中包含"INT",那么该字段的亲缘类型是INTEGER。
    2). 如果类型字符串中包含"CHAR"、"CLOB"或"TEXT",那么该字段的亲缘类型是TEXT,如VARCHAR。
    3). 如果类型字符串中包含"BLOB",那么该字段的亲缘类型是NONE。
    4). 如果类型字符串中包含"REAL"、"FLOA"或"DOUB",那么该字段的亲缘类型是REAL。
    5). 其余情况下,字段的亲缘类型为NUMERIC。

    2. 具体示例:

声明类型亲缘类型应用规则INT
INTEGER
TINYINT
SMALLINT
MEDIUMINT
BIGINT
UNSIGNED BIG INT
INT2
INT8INTEGER1CHARACTER(20)
VARCHAR(255)
VARYING CHARACTER(255)
NCHAR(55)
NATIVE CHARACTER(70)
NVARCHAR(100)
TEXT
CLOB TEXT2BLOBNONE3REAL
DOUBLE
DOUBLE PRECISION
FLOAT REAL4NUMERIC
DECIMAL(10,5)
BOOLEAN
DATE
DATETIME NUMERIC5

    注:在SQLite中,类型VARCHAR(255)的长度信息255没有任何实际意义,仅仅是为了保证与其它数据库的声明一致性。

三、比较表达式:

    在SQLite3中支持的比较表达式有:"=", "==", "<", "<=", ">", ">=", "!=", "<>", "IN", "NOT IN", "BETWEEN", "IS" and "IS NOT"。
    数据的比较结果主要依赖于操作数的存储方式,其规则为:
    1). 存储方式为NULL的数值小于其它存储类型的值。
    2). 存储方式为INTEGER和REAL的数值小于TEXT或BLOB类型的值,如果同为INTEGER或REAL,则基于数值规则进行比较。
    3). 存储方式为TEXT的数值小于BLOB类型的值,如果同为TEXT,则基于文本规则(ASCII值)进行比较。
    4). 如果是两个BLOB类型的数值进行比较,其结果为C运行时函数memcmp()的结果。

四、操作符:

    所有的数学操作符(+, -, *, /, %, <<, >>, &, and |)在执行之前都会先将操作数转换为NUMERIC存储类型,即使在转换过程中可能会造成数据信息的丢失。此外,如果其中一个操作数为NULL,那么它们 的结果亦为NULL。在数学操作符中,如果其中一个操作数看上去并不像数值类型,那么它们结果为0或0.0。

-------

上面的这一小段来自:http://www.cnblogs.com/stephen-liu74/archive/2012/02/22/2325258.html,其实这里也有一份,不过这一份嘛 ,就整理的不太好了。所以我扔到code框里。。其实以前有一份pdf的,但一下子找不到了。而且。。。mac下看chm和pdf都不太爽。。

http://www.21andy.com/blog/20091211/1489.html
  1. NULL  
  2. INTEGER  
  3. REAL  
  4. TEXT  
  5. BLOB  
  6. 但实际上,sqlite3也接受如下的数据类型:  
  7. smallint 16 位元的整数。  
  8. interger 32 位元的整数。  
  9. decimal(p,s) p 精确值和 s 大小的十进位整数,精确值p是指全部有几个数(digits)大小值,s是指小数点後有几位数。如果没有特别指定,则系统会设为 p=5s=0 。  
  10. float   32位元的实数。  
  11. double   64位元的实数。  
  12. char(n)   n 长度的字串,n不能超过 254。  
  13. varchar(n) 长度不固定且其最大长度为 n 的字串,n不能超过 4000。  
  14. graphic(n) 和 char(n) 一样,不过其单位是两个字元 double-bytes, n不能超过127。这个形态是为了支援两个字元长度的字体,例如中文字。  
  15. vargraphic(n) 可变长度且其最大长度为 n 的双字元字串,n不能超过 2000  
  16. date   包含了 年份、月份、日期。  
  17. time   包含了 小时、分钟、秒。  
  18. timestamp 包含了 年、月、日、时、分、秒、千分之一秒。  
  19.   
  20.    
  21.   
  22. 1.存储类别  
  23. 第二版把所有列的值都存储成ASCII文本格式。第三版则可以把数据存储成整数和实数,还可以存储BLOB数据.  
  24.   
  25. Each value stored in an SQLite数据库中存储的每个值都有一个属性,都属于下面所列类中的一种,(被数据库引擎所控制)  
  26.   
  27. 空.这个值为空值  
  28.   
  29. 整数.值被标识为整数,依据值的大小可以依次被存储为1,2,3,4,5,6,7,8.  
  30.   
  31. 实数. 所有值都是浮动的数值,被存储为8字节的IEEE浮动标记序号.  
  32.   
  33. 文本. 值为文本字符串,使用数据库编码存储(TUTF-8, UTF-16BE or UTF-16-LE).  
  34.   
  35. BLOB. 值是BLOB数据,如何输入就如何存储,不改变格式.  
  36.   
  37. 像SQLite2.0版一样,在3.0版中,除了INTEGER PRIMARY KEY,数据库中的任何列都可以存储任何类型的数据.这一规则也有例外,在下面的"严格相似模式"中将描述.  
  38.   
  39. 输入SQLite的所有值,不管它是嵌入 SQL语句中的文字还是提前编译好的绑定在SQL语句中的值,在SQL语句执行前都被存储为一个类.在下面所描述的情况下,数据库引擎将在执行时检查并把值在数字存储类(整数和实数)和文本类间转换.  
  40.   
  41. 存储的类别最初被分类为如下:  
  42.   
  43. 具体的值比如SQL语句部分的带双引号或单引号的文字被定义为文本,如果文字没带引号并没有小数点或指数则被定义为整数,如果文字没带引号但有小数点或指数则被定义为实数,如果值是空则被定义为空值.BLOB数据使用符号X'ABCD'来标识.  
  44.   
  45. Values supplied using the 被输入的值使用sqlite3_bind_* APIs的被分类一个存储等级,这等级是和原来的类基本相一致的. (比如sqlite3_bind_blob()绑定一个BLOB的值).  
  46.   
  47. 值的分类是SQL分等级操作的结果,决定于最远的操作表达式.用户定义的功能也许会把值返回任意的类.在编译的时候来确定表达式的存储类基本是不可能的.  
  48.   
  49. 2. 列之间的亲和性  
  50. 在SQLite3.0版中,值被定义为什么类型只和值自身有关,和列没有关系,和变量也没有关系. (这有时被称作 弱类型.)所有其它的我们所使用的数据库引擎都受静态类型系统的限制,其中的所有值的类是由其所属列的属性决定的,而和值无关.  
  51.   
  52. 为了最大限度的增加SQLite数据库和其他数据库的兼容性,SQLite支持列的"类型亲和性". 列的亲和性是为该列所存储的数据建议一个类型.我们要注意是建议而不是强迫.在理论上来讲,任何列依然是可以存储任何类型的数据的. 只是针对某些列,如果给建议类型的话,数据库将按所建议的类型存储.这个被优先使用的数据类型则被称为"亲和类型".  
  53.   
  54. 在SQLite3.0版中,数据库中的每一列都被定义为以下亲和类型中的一种:  
  55.   
  56. 文本  
  57. 数字的  
  58. 整数  
  59. 无  
  60. 一个具有类型亲和性的列按照无类型,文本,或BLOB存储所有的数据.如果数字数据被插入一个具有文本类型亲和性的列,在存储之前数字将被转换成文本.  
  61.   
  62. 一个具有数字类型亲和性的列也许使用所有的五个存储类型存储值.当文本数据被插入一个数字列时,在存储之前,数据库将尝试着把文本转换成整数或实数.如果能成功转换的话,值将按证书活实数的类型被存储. 如果不能 成功转换的话,值则只能按文本类型存储了,而不会被转换成无类型或BLOB类型来存储.  
  63.   
  64. 一个具有整数亲和力的列在转换方面和具有数字亲和力的列是一样的,但也有些区别 ,比如没有浮动量的实值(文本值转换的值)被插入具有整数亲和力的列时,它将被转换成整数并按整数类型存储.  
  65.   
  66. 一个具有无类型亲和力的列不会优先选择使用哪个类型.在数据被输入前它不会强迫数据转换类型.  
  67.   
  68. 2.1 列的亲和性的决定  
  69. 一个列的亲和类型是由该列所宣称的类型决定的.遵守以下规则:  
  70.   
  71. 如果数据类型包括字符串"INT"那么它被定义成具有整数亲和性.  
  72.   
  73. 如果列中的数据类型包括以下任何的字符串 "CHAR", "CLOB", or "TEXT" 那么这个列则具有文本亲和性.要注意VARCHAR类型包括字符串"CHAR"因此也具有文本类型亲和性.  
  74.   
  75. 如果一个列的数据类型包括字符串"BLOB"或者如果数据类型被具体化了,那么这个列具有无类型亲和性.  
  76.   
  77. 否则就具有数字类型亲和性.  
  78.   
  79. 如果表格使用If "CREATE TABLE AS SELECT..."语句生成的,那么所有的列则都没有具体的数据类型,则没有类型亲和性.  
  80.   
  81. 2.2 列的亲和性的例子  
  82. CREATE TABLE t1(  
  83.     t TEXT,  
  84.     nu NUMERIC,  
  85.     i INTEGER,  
  86.     no BLOB  
  87. );  
  88.   
  89. -- Storage classes for the following row:  
  90. -- TEXT, REAL, INTEGER, TEXT  
  91. INSERT INTO t1 VALUES('500.0', '500.0', '500.0', '500.0');  
  92.   
  93. -- Storage classes for the following row:  
  94. -- TEXT, REAL, INTEGER, REAL  
  95. INSERT INTO t1 VALUES(500.0, 500.0, 500.0, 500.0);  
  96.   
  97. 3.比较表达式  
  98. 像SQLite2.0版一样,3.0版的一个特性是二进制比较符'=', '<', '<=', '>=' and '!=',一个操作'IN'可以测试固定的成员资格, 三重的比较操作符'BETWEEN'.  
  99.   
  100. 比较的结果决定于被比较的两个值的存储类型。遵循以下规则:  
  101.   
  102. 一个具有空存储类型的值被认为小于任何值(包括另外一个具有空存储类型的值)。  
  103.   
  104. 一个整数值或实数值小于任何文本值和BLOB值。 当一个整数或实数和另一个整数或实数相比较的时候,则按照实际数值来比较。  
  105.   
  106. 一个文本值小于BLOB值。当两个文本值相比较的时候,则用C语言类库中的memcmp()函数来比较。然而,有时候也不是这样的,比如在下面所描述的“用户定义的整理顺序”情况下。  
  107.   
  108. 当两个BLOB文本被比较的时候,结果决定于memcmp()函数。  
  109.   
  110. 在开始比较前,SQLite尝试着把值在数字存储级(整数和实数)和文本之间相互转换。下面列举了关于如何比较二进制值的例子。在着重号below中使用的表达式可以表示SQL标量表达式或是文本但不是一个列值。  
  111.   
  112. 当一个列值被比拟为表达式结果的时候,在比较开始前,列的亲和性将被应用在表达结果中。  
  113.   
  114. 当两个列值比较的时候,如果一个列有整数或数字亲和性的时候,而另外一列却没有,那么数字亲和性适用于从非数字列提取的任何具有文本存储类型的值. P>  
  115.   
  116. 当比较两个表达式的结果时,不发生任何转换,直接比较结果.如果一个字符串和一个数字比较, 数字总是小于字符串.  
  117.   
  118. 在SQLite中, 表达式"a BETWEEN b AND c"等于表达式 "a >= b AND a <= c",在比较表达式时,a可以是具有任何亲和性.  
  119.   
  120. 表达式 "a IN (SELECT b ....)" 在比较时遵循上面所提到的三条规则,是二进制比较.(例如, 在一个相似的样式 "a = b"). 例如,如果'b'是一个列值, 'a' 是一个表达式,那么,在开始比较前,'b'的亲和性就被转换为'a'的亲和性了.  
  121.   
  122. SQLite把表达式 "a IN (x, y, z)" 和 "a = z OR a = y OR a = z"视为相等.  
  123.   
  124. 3.1 比较例子  
  125. CREATE TABLE t1(  
  126.     a TEXT,  
  127.     b NUMERIC,  
  128.     c BLOB  
  129. );  
  130.   
  131. -- Storage classes for the following row:  
  132. -- TEXT, REAL, TEXT  
  133. INSERT INTO t1 VALUES('500', '500', '500');  
  134.   
  135. -- 60 and 40 are converted to '60' and '40' and values are compared as TEXT.  
  136. SELECT a < 60, a < 40 FROM t1;  
  137. 1|0  
  138.   
  139. -- Comparisons are numeric. No conversions are required.  
  140. SELECT b < 60, b < 600 FROM t1;  
  141. 0|1  
  142.   
  143. -- Both 60 and 600 (storage class NUMERIC) are less than '500'  
  144. -- (storage class TEXT).  
  145. SELECT c < 60, c < 600 FROM t1;  
  146. 0|0  
  147.   
  148. 4. 运算符  
  149. 所有的数学运算符(所有的运算符而不是连锁作用标记符"||")运算对象首先具有数字亲和性, 如果一个或是两个都不能被转换为数字那么操作的结果将是空值。  
  150.   
  151. 对于连接作用操作符,所有操作符将首先具有文本亲和性。如果其中任何一个操作符不能被转换为文本(因为它是空值或是BLOB)连接作用操作符将是空值。  
  152.   
  153. 5. 分类,排序,混合挑选  
  154. 当用子句ORDER挑选值时,空值首先被挑选出来, 然后是整数和实数按顺序被挑选出来, 然后是文本值按memcmp()顺序被挑选出来, 最后是BLOB值按memcmp()顺序被挑选出来.在挑选之前, 没有存储类型的值都被转换了.  
  155.   
  156. When grouping values with the 当用GROUP BY子句给值分组时,具有不同存储类型的值被认为是不同的, 但也有例外, 比如,一个整数值和一个实数值从数字角度来说是相等的,那么它们则是相等的.用GROUP by 子句比较完后,值不具有任何亲和性.  
  157.   
  158. 混合挑选操作符UNION, INTERSECT and EXCEPT 在值之间实行绝对的比较,同样的亲和性将被应用于所有的值,这些值将被存储在一个单独的具有混合SELECT的结果组的列中. 被赋予的亲和性是该列的亲和性,这个亲和性是由剩下的大部分的混合SELECTS返回的,这些混合SELECTS在那个位置上有列值(而不是其它类型的表达式). 如果一个给定的混合SELECT列没有SELECTS的量, 那么在比较前,该列的值将不具有任何亲和性.  
  159.   
  160. 6. 其它亲和性模式  
  161. 以上的部分所描述的都是数据库引擎在正常亲和性模式下所进行的操作, SQLite将描述其它两种亲和性模式,如下:  
  162.   
  163. 严格亲和性模式.在这种模式下,如果需要值之间相互转换数据存储类型的话,数据库引擎将发送错误报告,当前语句也将会重新运行.  
  164.   
  165. 无亲和性模式.在这种模式下,值的数据存储类型不发生转换.具有不同存储类型的值之间不能比较,但整数和实数之间可以比较.  
  166.   
  167. 7.用户定义的校对顺序  
  168. By default, when 当SQLite比较两个文本值的时候,通过系统设定,不管字符串的编码是什么,用memcmp()来比较. SQLite第三版允许用户提供任意的函数来代替memcmp(),也就是用户定义的比较顺序.  
  169.   
  170. 除了系统预设的BINARY比较顺序,它是用memcmp()函数比较,SQLite还包含了两个额外的内置比较顺序函数, NOCASE和REVERSE:  
  171.   
  172. BINARY -使用memcmp()比较字符串数据, 不考虑文本编码.  
  173. REVERSE -用倒序比较二进制文本.  
  174. NOCASE - 和二进制一样,但在比较之前,26位的大写字母盘要被折合成相应的小写字母盘.  
  175. 7.1 分配比较顺序  
  176. 每个表格中的每个列都有一个预设的比较类型.如果一个比较类型不是二进制所要求的,比较的子句将被具体化为 列的定义 来定义该列.  
  177.   
  178. 当用SQLite比较两个文本值时,比较顺序将按照以下的规则来决定比较的结果.文档的第三部分和第五部分描述在何种场合下发生这种比较.  
  179.   
  180. 对于二进制比较符(=, <><= and >=),如果每个操作数是一列的话,那么该列的默认比较类型决定于所使用的比较顺序. 如果两个操作数都是列的话,那么左边的操作数的比较类型决定了所要使用的比较顺序.如果两个操作数都不是一列,将使用二进制来比较.  
  181.   
  182. 表达式"x BETWEEN y and z"和 "x >= y AND x <= z"是相同的. 表达式"x IN (SELECT y ...)" 和表达式 "xx = y" 使用同样的方法来操作,这是为了决定所要使用的比较顺序.如果X是一列或者二进制的,则"x IN (y, z ...)" 形式的表达式所使用的比较顺序是X的默认的比较类型.  
  183.   
  184. ORDER BY clause that is part of a SELECT statement may be assigned a collation sequence to be used for the sort operation explicitly. In this case the explicit collation sequence is always used. Otherwise, if the expression sorted by an ORDER BY clause is a column, then the default collation type of the column is used to determine sort order. If the expression is not a column, then the BINARY collation sequence is used.  
  185.   
  186. 7.2 比较顺序的例子  
  187. 下面的例子介绍了The examples below identify the collation sequences that would be used to determine the results of text comparisons that may be performed by various SQL statements. Note that a text comparison may not be required, and no collation sequence used, in the case of numeric, blob or NULL values.  
  188.   
  189. CREATE TABLE t1(  
  190.     a,                 -- default collation type BINARY  
  191.     b COLLATE BINARY, -- default collation type BINARY  
  192.     c COLLATE REVERSE, -- default collation type REVERSE  
  193.     d COLLATE NOCASE   -- default collation type NOCASE  
  194. );  
  195.   
  196. -- Text comparison is performed using the BINARY collation sequence.  
  197. SELECT (a = b) FROM t1;  
  198.   
  199. -- Text comparison is performed using the NOCASE collation sequence.  
  200. SELECT (d = a) FROM t1;  
  201.   
  202. -- Text comparison is performed using the BINARY collation sequence.  
  203. SELECT (a = d) FROM t1;  
  204.   
  205. -- Text comparison is performed using the REVERSE collation sequence.  
  206. SELECT ('abc' = c) FROM t1;  
  207.   
  208. -- Text comparison is performed using the REVERSE collation sequence.  
  209. SELECT (c = 'abc') FROM t1;  
  210.   
  211. -- Grouping is performed using the NOCASE collation sequence (i.e. values  
  212. -- 'abc' and 'ABC' are placed in the same group).  
  213. SELECT count(*) GROUP BY d FROM t1;  
  214.   
  215. -- Grouping is performed using the BINARY collation sequence.  
  216. SELECT count(*) GROUP BY (d || '') FROM t1;  
  217.   
  218. -- Sorting is performed using the REVERSE collation sequence.  
  219. SELECT * FROM t1 ORDER BY c;  
  220.   
  221. -- Sorting is performed using the BINARY collation sequence.  
  222. SELECT * FROM t1 ORDER BY (c || '');  
  223.   
  224. -- Sorting is performed using the NOCASE collation sequence.  
  225. SELECT * FROM t1 ORDER BY c COLLATE NOCASE;  

如前文所述,SQLite在处理数据类型时与其它的数据库不同。区别在于它所支持的类型以及这些类型是如何存储、比较、强化(enforc)和指派(assign)。下面各节介绍SQLite处理数据类型的独特方法和它与域完整性的关系。

对于数据类型,SQLite的域完整性被称为域亲和性(affinity)更合适。在SQLite中,它被称为类型亲和性(type affinity)。为了理解类型亲和性,你必须先要理解存储类和弱类型(manifesttyping)。

SQLite有5个原始的数据类型,被称为存储类。存储类这个词表明了一个值在磁盘上存储的格式,其实就是类型或数据类型的同义词。这5个存储类在表4-6中描述。

表 4-6 SQLite存储类

                       

 

名称

  

说明

  

INTEGER

  

整数值是全数字(包括正和负)。整数可以是1, 2, 3, 4, 6或 8字节。整数的最大范围(8 bytes)是{-9223372036854775808, 0, +9223372036854775807}。SQLite根据数字的值自动控制整数所占的字节数。

 

空注:参可变长整数的概念。

  

REAL

  

实数是10进制的数值。SQLite使用8字节的符点数来存储实数。

  

TEXT

  

文本(TEXT)是字符数据。SQLite支持几种字符编码,包括UTF-8和UTF-16。字符串的大小没有限制。

  

BLOB

  

二进制大对象(BLOB)是任意类型的数据。BLOB的大小没有限制。

  

NULL

  

NULL表示没有值。SQLite具有对NULL的完全支持。

 

SQLite通过值的表示法来判断其类型,下面就是SQLite的推理方法:

l  SQL语句中用单引号或双引号括起来的文字被指派为TEXT。

l  如果文字是未用引号括起来的数据,并且没有小数点和指数,被指派为INTEGER。

l  如果文字是未用引号括起来的数据,并且带有小数点或指数,被指派为REAL。

l  用NULL说明的值被指派为NULL存储类。

l  如果一个值的格式为X'ABCD',其中ABCD为16进制数字,则该值被指派为BLOB。X前缀大小写皆可。

SQL函数typeof()根据值的表示法返回其存储类。使用这个函数,下面SQL语句返回的结果为:

sqlite> select typeof(3.14),typeof('3.14'), typeof(314), typeof(x'3142'), typeof(NULL);

typeof(3.14)   typeof('3.14')  typeof(314)    typeof(x'3142')       typeof(NULL)

real                text                integer           blob                      null

 

SQLite单独的一个字段可能包含不同存储类的值。请看下面的示例:

sqlite> DROP TABLE domain;

sqlite> CREATE TABLE domain(x);

sqlite> INSERT INTO domain VALUES(3.142);

sqlite> INSERT INTO domain VALUES('3.142');

sqlite> INSERT INTO domain VALUES(3142);

sqlite> INSERT INTO domain VALUES(x'3142');

sqlite> INSERT INTO domain VALUES(NULL);

sqlite> SELECT ROWID, x, typeof(x) FROMdomain;

返回结果为:

rowid      x            typeof(x)

1            3.142      real

2            3.142      text

3            3142     integer

4            1B        blob

5            NULL    null

这带来一些问题。这种字段中的值如何存储和比较?如何对一个包含了INTEGER、REAL、TEXT、BLOB和NULL值的字段排序?一个整数和一个BLOB如何比较?哪个更大?它们能相等吗?

答案是:具有不同存储类的值可以存储在同一个字段中。可以被排序,因为这些值可以相互比较。有完善定义的规则来做这件事。不同存储类的值可以通过它们各自类的“类值”进行排序,定义如下:

1. NULL存储类具有最低的类值。一个具有NULL存储类的值比所有其它值都小(包括其它具有NULL存储类的值)。在NULL值之间,没有特别的可排序值。

2. INTEGER或REAL存储类值高于NULL,它们的类值相等。INTEGER值和REAL值通过其数值进行比较。

3. TEXT存储类的值比INTEGER和REAL高。数值永远比字符串的值低。当两个TEXT值进行比较时,其值大小由“排序法”决定。

4. BLOB存储类具有最高的类值。具有BLOB类的值大于其它所有类的值。BLOB值之间在比较时使用C函数memcmp()。

所以,当SQLite对一个字段进行排序时,首先按存储类排序,然后再进行类内的排序 (NULL类内部各值不必排序) 。下面的SQL说明了存储类值的不同:

sqlite> SELECT 3 < 3.142, 3.142 <'3.142', '3.142' < x'3000', x'3000' < x'3001';

返回:

3 < 3.142              3.142 < '3.142'              '3.142'< x'3000'     x'3000' < x'3001'

1                   1                          1                          1

 

弱类型(manifest typing)

SQLite使用弱类型。

看下面的表:

CREATE TABLE foo( x integer,

    y text, z real );

向该表插入一条记录:

INSERT INTO foo VALUES ('1', '1', '1');

当SQLite创建这条记录时,x、y和z这3个字段中存储的是什么类型呢?答案是INTEGER, TEXT和REAL。

 

再看下面例子:

CREATE TABLE foo(x, y, z);

现在执行同样的插入语句:

INSERT INTO foo VALUES ('1', '1', '1');

现在,x、y和z中存储的是什么类型呢?答案是TEXT、TEXT和TEXT。

那么,是否SQLite的字段类型默认为TEXT呢?再看,还是第2个表,执行如下插入语句:

INSERT INTO foo VALUES (1, 1.0, x'10');

现在,x、y和z中存储的是什么类型呢?答案是INTEGER、REAL和BLOB。

 

如果你愿意,可以为SQLite的字段定义类型,这看起来跟其它数据库一样。但这不是必须的,你可以尽管违反类型定义。这是因为在任何情况下,SQLite都可以接受一个值并推断它的类型。

总之,SQLite的弱类型可表示为:1)字段可以有类型,2)类型可以通过值来推断。类型亲和性介绍这两个规定如何相互关联。所谓类型亲和性就是在强类型(strict typing)和动态类型(dynamic typing)之间的平衡艺术。

类型亲和性(Type Affinity)

在SQLite中,字段没有类型或域。当给一个字段声明了类型,该字段实际上仅仅具有了该类型的新和性。声明类型和类型亲和性是两回事。类型亲和性预定 SQLite用什么存储类在字段中存储值。在存储一个给定的值时到底SQLite会在该字段中用什么存储类决定于值的存储类和字段亲和性的结合。我们先来介绍一下字段如何获得它的亲和性。

字段类型和亲和性

首先,每个字段都具有一种亲和性。共有四种亲和性:NUMERIC、INTEGER、TEXT和NONE。一个字段的亲和性由它预声明的类型决定。所以,当你为字段声明了类型,从根本上说是为字段指定了亲和性。SQLite按下面的规则为字段指派亲和性:

l  默认的,一个字段默认的亲和性是NUMERIC。如果一个字段不是INTEGER、TEXT或NONE的,那它自动地被指派为NUMERIC亲和性。

l  如果为字段声明的类型中包含了'INT'(无论大小写),该字段被指派为INTEGER亲和性。

l  如果为字段声明的类型中包含了'CHAR'、'CLOB'或'TEXT'(无论大小写),该字段被指派为TEXT亲和性。如'VARCHAR'包含了'CHAR',所以被指派为TEXT亲和性。

l  如果为字段声明的类型中包含了'BLOB'(无论大小写),或者没有为该字段声明类型,该字段被指派为NONE亲和性。

注意:如果没有为字段声明类型,该字段的亲和性为NONE,在这种情况下,所有的值都将以它们本身的(或从它们的表示法中推断的)存储类存储。如果你暂时还不确定要往一个字段里放什么内容,或准备将来修改,用NONE亲和性是一个好的选择。但SQLite默认的亲和性是NUMERIC。例如,如果为一定字段声明了类型JUJYFRUIT,该字段的亲和性不是NONE,因为SQLite不认识这种类型,会给它指派默认的NUMERIC亲和性。所以,与其用一个不认识的类型最终得到NUMERIC亲和性,还不如不为它指定类型,从而使它得到NONE亲和性。

亲和性和存储

亲和性对值如何存储到字段有影响,规则如下:

l  一个NUMERIC字段可能包括所有5种存储类。一个NUMERIC字段具有数字存储类的偏好(INTEGER和REAL)。当一个TEXT值被插入到一个NUMERIC字段,将会试图将其转化为INTEGER存储类;如果转化失败,将会试图将其转化为REAL存储类;如果还是失败,将会用TEXT存储类来存储。

l  一个INTEGER字段的处理很像NUMERIC字段。一个INTEGER字段会将REAL值按REAL存储类存储。也就是说,如果这个REAL值没有小数部分,就会被转化为INTEGER存储类。INTEGER字段将会试着将TEXT值按REAL存储;如果转化失败,将会试图将其转化为INTEGER存储类;如果还是失败,将会用TEXT存储类来存储。

l  一个TEXT字段将会把所有的INTEGER或REAL值转化为TEXT。

l  一个NONE字段不试图做任何类型转化。所有值按它们本身的存储类存储。

l  没有字段试图向NULL或BLOB值转化——如无论用什么亲和性。NULL和BLOB值永远都按本来的方式存储在所有字段。

这些规则初看起来比较复杂,但总的设计目标很简单,就是:如果你需要,SQLite会尽量模仿其它的关系型数据库。也就是说,如果你将SQLite看成是一个传统数据库,类型亲和性将会按你的期望来存储值。如果你声明了一个INTEGER字段,并向里面放一个整数,就会按整数来存储。如果你声明了一个具有 TEXT, CHAR或VARCHAR类型的字段并向里放一个整数,整数将会转化为TEXT。可是,如果你不遵守这些规定,SQLite也会找到办法来存储你的值。

亲和性的运行

让我们看一些例子来了解亲和性是如何工作的:

sqlite> CREATE TABLE domain(i int, nnumeric, t text, b blob);

sqlite> INSERT INTO domain VALUES(3.142,3.142,3.142,3.142);

sqlite> INSERT INTO domain VALUES('3.142','3.142','3.142','3.142');

sqlite> INSERT INTO domain VALUES(3142,3142,3142,3142);

sqlite> INSERT INTO domain VALUES(x'3142',x'3142',x'3142',x'3142');

sqlite> INSERT INTO domain VALUES(null,null,null,null);

sqlite> SELECT ROWID,typeof(i),typeof(n),typeof(t),typeof(b)FROM domain;

返回:

rowid      typeof(i)  typeof(n) typeof(t)  typeof(b)

1            real         real         text         real

2            real         real         text         text

3            integer    integer    text         integer

4            blob        blob        blob        blob

5            null         null         null         null

下面的SQL说明存储类的排序情况:

sqlite> SELECT ROWID, b, typeof(b) FROMdomain ORDER BY b;

返回:

rowid b typeof(b)

5 NULL null

1 3.142 real

3 3142 integer

2 3.142 text

4 1B blob

sqlite> SELECT ROWID, b, typeof(b),b<1000 FROM domain ORDER BY b;

返回:

rowid b typeof(b) b<1000

NULL null NULL

1 3.142 real 1

3 3142 integer 1

2 3.142 text 0

4 1B blob 0

存储类和类型转换

关于存储类,需要关注的另一件事是:存储类有时会影响到值如何进行比较。特别是SQLite有时在进行比较之前,会将值在数字存储类(INTEGER和REAL)和TEXT之间进行转换。为进行二进制的比较,遵循如下规则:

l  当一个字段值与一个表达式的结果进行比较,字段的亲和性会在比较之前应用于表达式的结果。

l  当两个字段值进行比较,如果一个字段拥有INTEGER或NUMERIC亲和性而另一个没有,NUMERIC亲和性会应用于非NUMERIC字段的TEXT值。

l  当两个表达式进行比较,SQLite不做任何转换。如果两个表达式有相似的存储类,则直接按它们的值进行比较;否则按类值进行比较。

请看下面例子:

sqlite> selectROWID,b,typeof(i),i>'2.9' from domain ORDER BY b;

rowid b typeof(i i>'2.9'

5 NULL null NULL

1 3.142 real 1

3 3142 integer 1

2 3.142 real 1

4 1B blob 1

也算是“强类型(STRICT TYPING)”

如果你需要比类型亲和性更强的域完整性,可以使用CHECK约束。你可以使用一个单独的内置函数和一个CHECK约束来实现一个“假的”强类型。