数据库系统概率学习攻略(第8组)

来源:互联网 发布:蚁群算法公式解析 编辑:程序博客网 时间:2024/05/20 02:54

数据库系统概论攻略(研讨题1-7)

研讨题1-7题题目如下:

 

 

1. 数据库系统概论

1)    就这个数据给出其两个以上的语义(李明,男,197205,江苏南京市,计算机系,1990)。

数据与其语义是分不开的,如果一条数据没有语义,那么它就是没有意义的。但是一条数据是可以有多个语义的。

本条数据我们可以赋予一下多个语义:

一、语义:学生姓名,性别,出生年月,籍贯,所在院系,入学时间。

解释:李明,1972年5月出生于江苏南京市,1990年就读于计算机系。

二、语义:学生姓名,性别,出生年月,大学所在地,所在院系,入学时间。

解释:李明,1972年5月出生,1990年考入于江苏南京市的一所大学的计算机系。

三、语义:学生姓名,性别,出生年月,籍贯,所在院系,毕业时间。

解释:李明,1972年5月出生于江苏南京市,1990年从计算机系毕业。

2)    怎么理解数据库定义中的:有组织、可共享?

这好比我们人类所生活的大自然,每个生态系统都是有组织的,每中动物也是有组织的生活在一起,而不是单一的物质或者物种构成的,而所有的资源,亦如空气,是所有的动物所共享的。

数据库定义中的有组织,就是按照数据的结构类型来组织存放在一起,而数据与数据之间也是联系的,彼此共用的。

数据库的可共享即一个数据库可以为多个用户使用,多个用户可以同时操作一个数据库。

3)    数据库的冗余度为零好不好?

物极必反,数据库的冗余度也是如此。数据库的冗余度不能为零,如果为零,数据之间将不会有联系,也不利于数据的之间的存储、修改。比如在学生选课表的数据库中,每名学生都能够选修多门课程,而一门课程不单单只有一名同学选修,所以当冗余度为零的时候,这时候就会把选修同一门课程的信息的课程名都删除掉,这就会导致数据库的缺陷,只显示一条有关该课程的信息。所以,数据库的冗余度为零并不好。

4)        怎么理解:数据独立性较高?数据的物理独立性和逻辑独立性?

数据独立性包括数据的物理独立性和逻辑独立性。

物理独立性是指数据在磁盘上的数据库中如何存储是由DBMS管理的,用户程序不需要了解,应用程序要处理的只是数据的逻辑结构,这样一来当数据的物理存储结构改变时,用户的程序不用改变。

逻辑独立性是指用户的应用程序与数据库的逻辑结构是相互独立的,也就是说,数据的逻辑结构改变了,用户程序也可以不改变。

5)        用文本文件储存数据和用数据库来存储数据有何优劣?

文件系统面向某一应用程序,共享性差,冗余度大,数据独立性差,记录内有结构,整体无结构,由应用程序自己控制。数据库系统面向现实世界,共享性高,冗余度小,具有较高的物理独立性和一定的逻辑独立性,整体结构化,用数据模型描述,由数据库管理系统提供数据的安全性、完整性、并发控制和恢复能力。

文件系统与数据库系统都是计算机系统中管理数据的软件。解析文件系统是操作系统的重要组成部分;而 DBMS 是独立于操作系统的软件。但是 DBMS 是在操作系统的基础上实现的;数据库中数据的组织和存储是通过操作系统中的文件系统来实现的。

6)        CSV文件是什么?

1、csv是最通用的一种文件格式,它可以非常容易地被导入各种PC表格及数据库中。

2、 csv是(逗号分隔值)的英文缩写,csv文件是一种用来存储数据的纯文本文件,通常都是用于存放电子表格或数据的一种文件格式。

3、打开的方法可以使用excel。

2. 数据模型及其组成

1)  信息世界与机器世界有何关系

信息世界是概念模型,机器世界为计算机上的数据模型,我们要把信息世界转换为机器世界

2)  信息世界与现实世界有何关系

信息世界由现实世界抽象而来,即把显示世界中的客观对象抽象为某一种信息结构。

3. 概念模型

模型:对现实世界中某个对象特征的模拟和抽象。

两类数据模型:第一类是数据模型,第二类是逻辑模型和物理模型.

数据模型:是数据库中用来对现实世界数据特征的抽象的工具,是数据库中用于提供信息表示和操作手段的形式架构。

概念模型:实际上是现实世界到机器世界的一个中间层次。概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流所试用的语言。

一、信息世界中的基本概念

(1)实体(Entity)客观存在并可相互区别的事物称为实体。可以是具体的人、事、物或抽象的概念。

(2)属性(Attribute)实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。

(3)码(Key)唯一标识实体的属性集称为码。

(4)域(Domain)属性的取值范围称为该属性的域。

(5)实体型(EntityType)用实体名及其属性名集合来抽象和刻画同类实体称为实

(6)实体集(EntitySet)同一类型实体的集合称为实体集

(7)联系(Relationship)

1.  现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系。

2.  实体内部的联系通常是指组成实体的各属性之间的联系

3.  实体之间的联系通常是指不同实体集之间的联系

一对一联系定义:

如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1

一对多联系定义:

如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1:n

多对多联系定义:

如果对于实体集A中的每一个实体,实体集B中有n个实体(n≥0)与之联系,反之,对于实体集B中的每一个实体,实体集A中也有m个实体(m≥0)与之联系,则称实体集A与实体B具有多对多联系,记为m:n

E-R图:

实体型:用矩形表示,矩形框内写明实体名

属性:用椭圆形表示,并用无向边将其与相应的实体连接起来

联系本身:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n或m:n)

联系的属性:联系本身也是一种实体型,也可以有属性。如果一个联系具有属性,则这些属性也要用无向边与该联系连接起来

4. 关系模型

关系(Relation)

一个关系对应通常说的一张表

元组(Tuple)

表中的一行即为一个元组

属性(Attribute)

表中的一列即为一个属性,给每一个属性起一个名称即属性名

主码(Key)

表中的某个属性组,它可以唯一确定一个元组。

域(Domain)

属性的取值范围。

分量

元组中的一个属性值。

关系模式

对关系的描述关系名(属性1,属性2,...,属性n)

学生(学号,姓名,年龄,性别,系,年级)

关系模式优缺点:

优点:

建立在严格的数学概念的基础上

概念单一

实体和各类联系都用关系来表示

对数据的检索结果也是关系

关系模型的存取路径对用户透明

具有更高的数据独立性,更好的安全保密性

简化了程序员的工作和数据库开发建立的工作

缺点:

存取路径对用户透明导致查询效率往往不如非关系数据模型

为提高性能,必须对用户的查询请求进行优化增加了开发DBMS的难度

5. 数据库系统结构

(1) 模式:(逻辑模式)

数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。一个数据库只有一个模式。

 

模式的地位:是数据库系统模式结构的中间层,与数据的物理存储细节和硬件环境无关,与具体的应用程序、开发工具及高级程序设计语言无关。

模式定义的内容:数据的逻辑结构(数据项的名字、类型、取值范围等),数据之间的联系,数据有关的安全性、完整性要求

 

(2) 外模式:(子模式/用户模式)

数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据库和逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的系统的逻辑表示。一个数据库可以有多个外模式。

 

外模式的地位:介于模式与应用之间

 

模式与外模式的关系:一对多。外模式通常是模式的子集。一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求。对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同。

 

外模式与应用的关系:一对多。同一外模式也可以为某一用户的多个应用系统所使用但一个应用程序只能使用一个外模式

(3) 内模式:存储模式或内视图)是数据物理结构和存储方式的描述,是数据在数据库内部实际存储的表示方式:

记录的存储方式(顺序,B树,hash方法存储),索引的组织方式,数据是否压缩存储,数据是否加密。数据存储记录结构的规定,一个数据库只有一个内模式

三级模式的优点:

(1)保证数据的独立性(内模式与模式分开物理独立;外模式与模式分开逻辑独立)

(2)简化用户窗口     

(3)有利于数据共享   

(4)利于数据的安全保密

(5)数据存储由DBMS管理(用户不用考虑存取路径等细节)

二级映像功能:

1) 外模式/模式映像(应用可扩充性)

定义外模式(局部逻辑结构)与模式(全局逻辑结构)之间的对应关系,映象定义通常包含在各自外模式的描述中,每一个外模式,数据库系统都有一个外模式/模式映象。

用途:保证数据的逻辑独立性

当模式改变时,数据库管理员修改有关的外模式/模式映象,使外模式保持不变

应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

(2) 模式/内模式映像(空间利用率,存取效率)

模式/内模式映像是唯一的,它定义了数据全局逻辑结构与存储结构之间的对应关。数据库中模式/内模式映象是唯一的。该映象定义通常包含在模式描述中。

用途:保证数据的物理独立性

当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变。应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性。

二级映像优点:

(1)保证了数据库外模式的稳定性。

(2)从底层保证了应用程序的稳定性,除非应用需求本身发生变化,否则应用程序一般不需要修改。

(3)数据与程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出去

 

 

6. 关系和关系模型

域:

是一组具有相同数据类型的值的集合。

笛卡尔积:

给定一组域D1,D2,...,Dn,这些域中可以有相同的。D1,D2,...,Dn的笛卡尔积为:D1×D2×...×Dn={(d1,d2,...,dn)|diDi,i=1,2,...,n}

所有域的所有取值的一个组合

元组(Tuple)

笛卡尔积中每一个元素(d1,d2,...,dn)叫作一个n元组(n-tuple)或简称元组(Tuple)

分量(Component)

笛卡尔积元素(d1,d2,...,dn)中的每一个值di叫作一个分量

关系:

1)  关系

D1×D2×...×Dn的子集叫作在域D1,D2,...,Dn上的关系,表示为R(D1,D2,...,Dn)

R:关系名

n:关系的目或度(Degree)

2)  元组

关系中的每个元素是关系中的元组,通常用t表示。

3)  单元关系与二元关系

当n=1时,称该关系为单元关系(Unaryrelation)或一元关系

当n=2时,称该关系为二元关系(Binaryrelation)

4)  关系的表示

关系也是一个二维表,表的每行对应一个元组,表的每列对应一个

5)  属性

n关系中不同列可以对应相同的域

n为了加以区分,必须对每列起一个名字,称为属性(Attribute)

n目关系必有n个属性

 

 

6)  码

候选码(Candidatekey)

若关系中的某一属性组的值能唯一地标识一个元组,则称该属性组为候选码

简单的情况:候选码只包含一个属性

全码(All-key)

最极端的情况:关系模式的所有属性组是这个关系模式的候选码,称为全码(All-key)

主码

若一个关系有多个候选码,则选定其中一个为主码(Primarykey)

主属性

候选码的诸属性称为主属性(Primeattribute)

不包含在任何侯选码中的属性称为非主属性(Non-Primeattribute)或非码属性(Non-keyattribute)

7. 关系操作和关系完整性

常用的关系操作:

查询:选择、投影、连接、除、并、交、差

数据更新:插入、删除、修改

查询的表达能力是其中最主要的部分

选择、投影、并、差、笛卡尔积是5种基本操作,其他操作可用基本操作来定义和导出

关系完整性:

实体完整性规则:

  若属性A是基本关系R的主属性,则属性A不能取空值

实体完整性规则的说明

(1)实体完整性规则是针对基本关系而言的。一个基本表通常对应现实世界的一个实体集。

(2)现实世界中的实体是可区分的,即它们具有某种唯一性标识。

(3)关系模型中以主码作为唯一性标识。

(4)主码中的属性即主属性不能取空值。

主属性取空值,就说明存在某个不可标识的实体,即存在不可区分的实体,这与第(2)点相矛盾,因此这个规则称为实体完整性

外码(ForeignKey):

设F是基本关系R的一个或一组属性,但不是关系R的码。如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外码

参照完整性规则:

若属性(或属性组)F是基本关系R的外码它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:

或者取空值(F的每个属性值均为空值)

或者等于S中某个元组的主码值

阅读全文
0 0