《数据库》总结

来源:互联网 发布:天池大数据竞赛官网 编辑:程序博客网 时间:2024/04/30 01:42

    数据库,我们的朋友,设计软件必不可少的得和它打交道,所以,学好它,是必须的

    数据库,想说爱你不容易,这篇博客也是姗姗来迟,在草稿箱里躺了好几天,动弹不了

    还是知识掌握的不够,知识与知识之间的衔接能力欠缺,复杂的知识联系不到简单的生活上……

    人生就像卫生纸,没事儿尽量少扯,好啦,接下来,步入正题


    数据管理大致经历了四个阶段:人工管理、文件系统、数据库、高级数据库,从简单到复杂,从低级到高级,技术越来越先进。

    数据库DB,database,是长期存储在计算机内,有组织的、统一管理的相关数据的集合。它能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点。

    数据库管理系统,DBMS,database management system,是位于用户和操作系统之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。数据库语言分为DDLDML两类。DBMS主要由查询处理器存储管理器两大部分组成。想想也是,因为它最大的作用一个是查询数据,一个就是存储数据,修改数据和增加数据放在存储数据之列。

    DBMS总是基于某种数据类型,可以分为层次型、网状型、关系型和面向对象型。

    数据库系统DBS,database system,是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。DBS是包含DBDBMS的计算机系统,DBS的全局结构体现了DBS的模块功能结构。

    在选定DBMS软件后,就要将概念模型按照选定的DBMS的特点转换成逻辑模型。DB的一切操作,包括定义、查询、更新及各种控制,都是通过DBMS进行的

    DBMS的工作进程如下:

    1.接受应用程序的数据请求和处理请求

    2.将用户的数据请求(高级指令)转换成复杂的机器代码(低层指令)

    3.实现对数据库的操作

    4.从对数据库的操作中接受查询结果

    5.对查询结果进行处理(格式转换)

    6.将处理结果返回给用户



    数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科。

    在数据处理中,数据描述将涉及到不同的范畴。从事物的特性到计算机中的具体表示,数据描述经历了三个阶段:概念设计、逻辑设计、物理设计。

    下图主要展示了各个设计阶段用到的事物:






      

   现实世界中,事物是相互联系的,这种联系必然要在数据库中有所反映,即实体并不是孤立静止存在的,实体和实体之间有联系。联系,relationship,是实体之间的相互关系,与一个联系有关的实体集个数,称为联系的元数。二元联系有三种类型:一对一、一对多、多对多。

 

    模型是对现实世界的抽象,在数据库技术中,我们用数据模型data model的概念描述数据库的结构和语义,对现实世界的数据进行抽象,从现实世界的信息到数据库存储的数据以及用户使用的数据是一个逐步抽象的过程。根据数据抽象的级别定义了四种模型:

    概念数据模型、逻辑数据模型、外部数据模型、内部数据模型


    概念模型:表达用户需求观点的数据全局逻辑结构

    逻辑模型:表达计算机实现观点的DB全局逻辑结构,

    外部模型:表达用户使用观点的DB局部逻辑结构,在应用系统中,常常是根据业务的特点划分成若干个业务单位, 每一个业务单位都有特定的约束和需求,在实际使用时,可以为不同的业务单位设计不同的外部模型

    内部模型:表达DB物理结构,又称为物理模型,是数据库最底层的抽象,它描述数据在磁盘或磁带上的存储方式(文件的结构)、存取设备(外存的空间分配)和存取方法(主索引和辅助索引)

 

    在用户(或应用程序)到数据库之间,DB的数据结构有三个层次:外部模型、逻辑模型和内部模型,这三个层次要用DB的数据定义语言DDLdata definition language,定义,定义以后的内容称为模式,即外模式、逻辑模式、内模式

 

    由于三层模式的数据结构可能不一致,即记录类型、字段类型的命名和组成可能不一样,因此需要三层模式之间的映像来说明外部记录、逻辑记录和内部记录之间的对应性

 

    数据抽象的过程,也就是数据库设计的过程,具体步骤如下:

         1.根据用户需求,设计数据库的概念模型,这是一个“综合”的过程

         2.根据转换规则,把概念模型转换成数据库的逻辑模型,这是一个“转换”的过程

         3.根据用户的特点,设计不同的外部模型,给程序员使用。也就是应用程序使用的是数据库的外部模型。外部模型与逻辑模型之间的对应性称为映像

         4.数据库实现时,要根据逻辑模型设计其内部模型,内部模型和逻辑模型之间的对应性称为映像

    一般,上述第一步称为DB的概念设计,第23步称为DB的逻辑设计,第4步称为DB的物理设计

    如下图:





 

   四种模型中,概念模型的抽象级别最高,现在采用的概念模型主要是实体联系(ER)模型,ER模型主要用ER图来表示,ER模型只能说明实体间语义的联系,还不能进一步说明详细的数据结构


ER模型的基本元素是实体、联系和属性

 

ER图主要成分就是实体类型和联系类型,转换算法就是如何把实体类型、联系类型转换成关系模式

 

关系数据库的基本结构是关系模式,模式设计理论主要包括数据依赖、范式、模式设计方法

数据依赖研究数据之间的联系,范式是关系模式的标准,而模式设计方法将是自动化设计的基础

 

在数据库中,数据冗余是指同一个数据存储了多次,由于数据冗余将会引起各种操作异常。通过模式分解成若干比较小的关系模式可以消除冗余

 

关系模式在分解时应保持“等价”,有数据等价和语义等价两种,分别用无损分解和保持依赖两个特征来衡量。前者能保持泛关系在投影连接以后仍能恢复回来,而后者能保证数据在投影或连接中其语义不会发生变化,也就是不会违反FD的语义。但无损分解与保持依赖两者之间没有必要的联系。

 

范式是衡量模式优劣的标准,范式表达了模式中数据依赖之间应满足的联系。如果关系模式R3NF,那么R上成立的非平凡FD都应该左边是超键或右边是非主属性。如果关系模式RBCNF,那么R上成立的非平凡的FD都应该左边是超键。范式的级别越高,其数据冗余和操作异常现象就越少。

 

关系模式设计理论与ER模型之间的关系:


关系模式设计理论在数据库设计过程中起着指导思想的作用。数据库设计者应时刻想着如何消除数据冗余和数据不一致现象。概念设计主要设计ER模型,逻辑设计根据转换规则把ER模型转换成关系模式集。如果转换成的关系模式不是2NF3NF,那么就应该到ER模型中去找问题。也就是在先前设计ER模型时有问题,譬如实体的属性中有多值属性,或实体中包含了联系。因此掌握了关系模式设计理论就能提高ER模型设计的质量






关系模型有三个重要组成部分:数据结构、数据操纵、数据完整性规则

 

DBS运行时,DBMS要对DB进行监控,DBS运行的最小逻辑工作单位为“事务”,事务是构成单一逻辑工作单元的操作集合,要么完整的执行,要么完全不执行。

 

触发器是一个能由系统自动执行对数据库修改的语句,由事件、条件、动作组成。

 

存储过程的优点主要有提供了安全机制、改进了执行性能、减少了网络流量和增强了代码的重用性

 


 下图展示的是数据库生命周期:




1 0
原创粉丝点击