数据库设计范式

来源:互联网 发布:淘宝女装店铺 编辑:程序博客网 时间:2024/06/07 05:20

数据库设计三大范式

基础知识:

首先是基础概念,也就是术语:

(1)       实体(entity):就是实际应用中要用数据描述的事物,一般是名词。

(2)       字段(fields):就是一项数据,也就是我们平常所说的“列”。

(3)       记录(record):一个实体的一个实例所特有的相关数据项的集合,也就是我们平常所说的“行”。

(4)       键(key):可唯一标识一条记录的一个字段或字段集。

(5)       主键(primary key):用于唯一标识一个表中的一条记录的键。每个主键应该具有下列特征:1.  唯一的。2.最小的(尽量选择最少键的组合)。3.非空。4.不可更新的(不能随时更改)

(6)       外键(foreign keys):对连接父表和子表的相关记录的主键字段的复制。

(7)       依赖表(dependent table):也称为弱实体(weak entity)是需要用父表标识的子表。

(8)       关联表(associative table):是多对多关系中两个父表的子表。

(9)       实体完整性:每个表必须有一个有效的主键。

(10)   参照完整性:没有不相匹配的外键值。

具体例子:

            假设你需要为一个在线视频娱乐厅设计数据库,用它记录每个会员的消费时间。娱乐厅必须掌握会员的基本信息,包括他们的电子邮箱、访问在线娱乐厅的口令、他们的姓名以及电话号码。当会员每次访问娱乐厅时都会创建一个进程id,而且必需记录进程的开始时间和结束时间。如图:

上图是规范化的设计。下面展示一个非规范化的设计。如图:

   

那么非规范化的设计有什么利弊呢?

优点:很明显,非规范化设计没有外键。这样就简化了某些相关操作。

缺点:其实潜在的问题是致命的。

1.                   更新问题。当有两条主键(id)不一样,但其他信息完全相同的数据遇到更新时,其中一条的数据更新了,但另一条没有更新,结果产生不一致的数据。

2.                   插入问题。当插入一条数据时,插入信息只是表属性的一部分。例如上例中只插入一个MEMBER的基本信息(email,password,fname,iname,phone),在非规范化设计中是禁止的,因为该数据信息不完整。

这些问题导致了在构造关系数据库时一些规则的出现,这些就是范式。

为了建立冗余较小、结构合理的数据库,设计数据库时必须遵循一定的规则。在关系型数据库中这种规则就称为范式。范式是符合某一种设计要求的总结。要想设计一个结构合理的关系型数据库,必须满足一定的范式。

                 

在实际开发中最为常见的设计范式有三个:

1.第一范式(确保每列保持原子性,表中所有字段仅包含单值)

第一范式是最基本的范式。如果数据库表中的所有字段值都是不可分解的原子值,就说明该数据库表满足了第一范式。

第一范式的合理遵循需要根据系统的实际需求来定。比如某些数据库系统中需要用到“地址”这个属性,本来直接将“地址”属性设计成一个数据库表的字段就行。但是如果系统经常会访问“地址”属性中的“城市”部分,那么就非要将“地址”这个属性重新拆分为省份、城市、详细地址等多个部分进行存储,这样在对地址中某一部分操作的时候将非常方便。这样设计才算满足了数据库的第一范式,如下表所示。

上表所示的用户信息遵循了第一范式的要求,这样在对用户使用城市进行分类的时候就非常方便,也提高了数据库的性能。

                

2.第二范式(确保表中的每列都和主键相关,表中的每个非键字段由整个主键确定,且不能由主键自身的一部分确定。因此,2NF的违例只会出现在主键是由超过一个字段构成的表中)

第二范式在第一范式的基础之上更进一层。第二范式需要确保数据库表中的每一列都和主键相关,而不能只与主键的某一部分相关(主要针对联合主键而言)。也就是说在一个数据库表中,一个表中只能保存一种数据,不可以把多种数据保存在同一张数据库表中。

比如要设计一个订单信息表,因为订单中可能会有多种商品,所以要将订单编号和商品编号作为数据库表的联合主键,如下表所示。

 订单信息表

这样就产生一个问题:这个表中是以订单编号和商品编号作为联合主键。这样在该表中商品名称、单位、商品价格等信息不与该表的主键相关,而仅仅是与商品编号相关。所以在这里违反了第二范式的设计原则。

而如果把这个订单信息表进行拆分,把商品信息分离到另一个表中,把订单项目表也分离到另一个表中,就非常完美了。如下所示。

这样设计,在很大程度上减小了数据库的冗余。如果要获取订单的商品信息,使用商品编号到商品信息表中查询即可。

                 

3.第三范式(确保每列都和主键列直接相关,而不是间接相关,表中不存在可以确定其他非关键字的非键字段)

第三范式需要确保数据表中的每一列数据都和主键直接相关,而不能间接相关

比如在设计一个订单数据表的时候,可以将客户编号作为一个外键和订单表建立相应的关系。而不可以在订单表中添加关于客户其它信息(比如姓名、所属公司等)的字段。如下面这两个表所示的设计就是一个满足第三范式的数据库表。

这样在查询订单信息的时候,就可以使用客户编号来引用客户信息表中的记录,也不必在订单信息表中多次输入客户信息的内容,减小了数据冗余。

0 0
原创粉丝点击