数据库概述

来源:互联网 发布:男人月薪4500 知乎 编辑:程序博客网 时间:2024/04/19 19:14

一、数据库技术的发展

信息(Information):信息是用来反应现实世界中事物的存在方式和运动运动状态。信息具有可感知、可存储、可加工、可传递和可再生的特点。

如:老师给学生讲课,老师讲课的内容中包含着大量的信息,而这些信息可通过声音、动作、图像等方式被学生理解,被感知;学生可通过写笔记、录音等方式将老师讲的信息记录、存储下来;学生在记录老师讲课内容时,不一定是按照老师所讲的内容一字不漏的方式记录下来,而是将信息加工成一种自己便于理解的方式进行记录;而学生给老师讲课实际上就是一种信息传递的过程;而从讲课的基础内容中推到出新的内容叫做信息的可再生。

数据(Data):是描述现实实物的符号记录。它的形式有多样,包括:图形、数字、声音、文字等。

信息与数据的关系:数据是信息的符号表示。

如:5000是一个数据,但如果5000表示的是一年的新生入学数则是一条信息。而两者在一般场合是可以不加区分的使用的。

数据处理:将原始信息表示成数据,这类数据称为原始数据;而将原始数据通过汇集、存储、推到等手段获得新的,对人们有用的结果的过程称为数据处理。


信息的价值:信息是有价值的,而信息的价值是与信息的及时性、准确性、完整性和可靠性密切相关的,而为了提高信息的价值,人们使用科学的方法对信息进行管理,这种科学方法就是数据库技术。


二、数据管理技术的发展和数据库技术的产生

在人们不断进行更高效的数据管理技术的探索中,大致经历了三个阶段:

人工管理阶段:该阶段的数据处理都是通过人工进行的,并且对数据没有存储,只为获得数据处理后的结果;数据处理程序和数据之间是一一对应关系。这就必然造成该阶段的两大缺点:数据和应用程序间的依赖性太强,不独立;数据组之间的有很多重复数据,数据冗余性大。

该阶段必然无法满足人们日益增长的物质文化需要,所以随着技术的发展,数据管理进入的第二个阶段:

文件系统阶段:该阶段首次引入数据存储,从此数据可以进行长期的保留,但该阶段的数据只是简单的存储在文件中,数据之间没有相互的联系,多处使用的数据,如果在一处进行修改,很容易造成数据的不一致;并且该阶段数据的存储很强的依赖于程序的使用方法,这就造成了不同程序间的数据不可通用,由此还可造成数据的冗余。

文件系统的缺点:数据冗余度大、数据不一致性、数据联系弱。

文件系统阶段经历了十多年的时间,随着计算机的软硬件技术的发展,使人们有能力对文件系统的缺点进行修正,于是,数据管理技术进入了并至今也处于的阶段——数据库系统阶段。

数据库系统阶段:该阶段采用复杂的数据模型对数据之间的结构进行表示,使得数据和数据之间有了联系,从而降低了数据的冗余度,提高了数据的易扩展性;首次在应用程序和数据之间引入数据库管理系统(Data Base Management System, DBMS),该系统使得数据相对于应用程序有较高的独立性。

数据库系统阶段特点:采用复杂的数据模型表示数据结构,数据共享性高、冗余小、易扩展,有较高的数据独立性。

而数据库阶段中引入的数据模型和改进的是数据库系统结构,也是当今我们正在使用的数据库系统的基础。下面,我们就来对数据库模型和数据库系统结构进行简单了解。


三、数据库系统结构

数据库系统主要是通过三级模式和二级映像实现了数据相对于应用程序的独立性。

三级模式是指:

概念模式:概念模式也称为模式,它是数据库中全部数据的逻辑结构和特征的描述,它是由若干个概念记录类型组成,只涉及行的描述,不涉及具体的值。概念模式的具体的值称为概念模式的一个实例。

例如:学生基本信息表中(学号 姓名 性别 出生年月日 入学成绩)称为一个概念模式,而学生基本信息表中的具体的值这是这个概念模式的一个实例。概念模式是不变、相对稳定的,而概念模式的实例是经常变动的。

外模式:外模式又称为用户模式或子模式。是用户用到的那部分数据的描述。

例如:用户在查看学生基本信息表中,只想要查看学生的学号和姓名信息,而用户查看信息时展现出来的(学号 姓名)则成为外模式。

内模式:也称存储模式,是数据物理结构和存储方式的描述。它定义有数据的内部记录类型、索引和文件组织方式。

例如:数据库管理员在定义学生基本信息表时,定义姓名字段为varchar2(20)类型,创建学号为该表的索引等等,这些称为内模式。

二级映像:

模式/内模式的映像:实现了概念模式到内模式之间的转换。

外模式/模式的映像:实现了外模式到内模式之间的转换。

数据独立性:

数据的物理独立性:是指当数据库的内模式发生改变时,数据的逻辑逻辑结构不变。但是为了保证应用程序能正确的执行,我们需要修改模式/内模式之间的映像。

数据的逻辑独立性:是指用户的应用程序与数据库的逻辑结构之间的相对独立性,当数据库的逻辑发生变化时,用户的应用程序可以不发生改变,但需要修改外模式/模式之间的映像。


四、数据模型

数据模型是对现实世界数据特征的一种抽象。数据模型的三要素包括:数据结构、数据操作、数据的约束条件。

数据模型又分为概念数据模型和基本数据模型。

概念数据模型:是易用户的角度对数据和信息进行建模。该模型的特点为易于用户理解,便于用户与数据库设计人员交流。

基本数据类型:是以计算机的角度对数据进行建模,实现现实世界中数据特征的抽象。

E-R模型:最为常用的概念数据模型。

E(Entity):现实世界中可以区别于其他事件或物体的的对象。实体可用一组特征(属性)来描述。

R(Relationship):用来描述不同实体之间的相互关系。

实体之间的联系类型分为:一对一、一对多、多对多

基本数据类型:

层次模型:树形结构。处根节点以外,每个节点有且只有一个父节点。

网状模型:允许一个以上节点无父节点,及一个节点有多个父节点。

关系模型:关系模型采用关系作为数据的组织形式,二维表可看做关系的实例。数据库系统采用关系模型作为基本数据类型。

关系模型中的基本术语:

关系:对应一张二维表

属性:二维表中的一列

关系模式:对关系的描述

元组:二维表中的一行

主码:能唯一标识元组的一个或多个属性值

域:属性的取值范围

分量:元组中的一个属性

0 0
原创粉丝点击