数据库应用-Datalog

来源:互联网 发布:西瓜数据集3.0 编辑:程序博客网 时间:2024/06/15 21:39

Relational Algebra

数据库系统中引入的relational algebra并不多,大部分可由多个基本的operation结合而来
minimal Relational algebra:Ω=π,σ,,β,,

安全访问(sichere Anfragen)

所谓安全访问,就是指无论在何种数据库状态(Datenbankzustand)下,都能得到有限个结果的访问//什么叫数据库状态,还没搞清楚????
举个反例:{x,y|¬R(x,y)} ; x,yN

为什么要用Logik作为访问语言

1.认识一种新的关系数据模型的访问语言,并且他们在表达能力上存在差别
2.Datalog做为一种基于Logik的访问语言,他与Relational Algebra等存在显著的区别。他有更加严谨的语言格式,这在带来一些有点的同时,也限制了他的可扩展性。学习Datalog可以开阔我们的视野
//这都是什么Motivation啊
3.Datalog可以表达一些Relational Algebra无法表达的问题,比如递归问题(z.B Transitive Huelle)

Logik的三个基本概念

Belegung:(翻译成分配不知道对不对)给一个变量分配一个值
Interpretation:(解释)就是signatur到konstant的映射I:{T,F}
Modell:表达为真得Belegung
//详细的就看形式系统吧(Formal System)
例子:val(A1)=1,val(A2)=0是Belegung,但不是Modell
//表达逻辑 和谓词逻辑有什么区别呢????
下面是谓词逻辑:
besuchtVorlesung(x)bestehtPruefung(x)
从一个确定的值域里面取值给一个变量赋值

Datalog//我还是Google一下datalog再说吧

Datalog是Prolog的子集(Teilmenge von Prolog)
基本例子:
关系:Person(Name,Age,Sex) Parent(Father,Mother)
father(X,Y):-Person(X,_,m),Parent(X,Y)
其中Person和Parent属于basis DB(Extensional Datenbank:EDB),father属于intentional Datenbank(IDB,即推到出来的 view)
基本例子2:
访问:
?-Mutter(X,Annie)
Mather(X,Y):-Person(X,_w),Parent(X,Y)
根据IDB规则查表找出Annie的母亲
问题:一个表达逻辑的可实现性是很难判断的,因此设置范围是很必要的
基本概念:
Atom://这就不说了
Literal:¬Atom或Atom
Klausel:Literal的析取
Horn-Klausel:·最多含有一个正的Atom的Klausel
Datalog-Programm: 有限个Horn-Klausel的集合
Horn-Klausel的例子:
Ancestor(X,Y):-Parent(X,Y)
Ancestor(X,Y):-Parent(X,Z),Ancestor(Z,Y)

Datenbank KonzeptRelationAttributeTupleAttribute valueView访Logik-Programm KonzeptPredicatevariableGrundklauselKonstantRegel

//倒数第三个有点不懂??

Recursion

Datalog可以实现Recursion,比如
Ancestor(X,Y):-Parent(X,Y)
Ancestor(X,Y):-Parent(X,Z),Ancestor(Z,Y)
IDB pradicate(如Ancestor)即可以在头部,也可以在躯干部分
用relational algebra则无解
**问题:**Recursion in Datalog和前面的transitiver Hülle有什么区别呢??//不知啊 好像前面transitiver Hülle 也木写的样子???一样??
Fixpunkt:即f(x)=x
运行算法:
IDB 初始为空
把regel应用于tupel上生成新的Tupel,然后循环
线性:
recursion分线性与非线性
如上述的regel即为线性的,他相应的非线性的regel为:
Ancestor(X,Y):-Parent(X,Y)
Ancestor(X,Y):-Ancestor(X,Z),Ancestor(Z,Y)
//没看出是怎么区分的???
有些系统不支持非线性的recursion
运行结束:
上述运行算法的在什么时候终结可以很明显的看出来,因为对于原始有限的n个tupel,那么他可以计算出他最多就能生成n(n+1)/2个Ancestor,因为有上限所有可以很好得识别出算法的结束

与Prolog的区别

Datalog的Regel的顺序无关紧要
Datalog不包含有非
Prolog例子:来自WikiPedia
gamble(X):-gotmeoney(X)
gamble(X):-gotcredit(X),NOT gotmeney(X)
cut-Operator:停止寻找替换,也就是说当找到一个匹配的规则后就不继续尝试其他规则
green cut:即当去掉第一个规则后,规则还是正确的
red cut:与green cut相反
prolog效率比较高,但是相对的也比较容易出现错误(fehleranfaelliger)
另外Datalog的Predicate的参数不能是复杂的计算如P(f(1),2)是不允许的

Datalog Programm的语义(Semantik)

//这节还在问人中 至今都木回复,主要不知道Modelltheoretisch和Beweistheoretisch是怎么区分的???

Monotone属性

Monotone属性即增大一个访问或Operator的input,不会导致输出的缩减。比如Diff Operator就是Monotone的,而与之相反selection就不是Monotone的
Datalog访问都有Monotone属性

Datalog的表达能力

去掉Rekursion的Datalog去掉diff Operator的Relational Algebra
例如:σA=C(R)R1(A,B,C):R(C,B,C)

带有非操作的recursion

在recursion 中加入非Operator可以提高表达能力,但同时也带来了一些麻烦,比如他可能导致访问的振动 比如下面的例子//好具体啊???
P(X):R(X),¬Q(X)
Q(X):R(X),¬P(X)
假设初始R有一个Tupel{0}, P,Q为空,那么第一轮之后P,Q都含有一个Tupel {0},但是第二轮,根据规则P,Q中得Tupel {0}则都会被删去,如此反复。
因此在regel的躯干中使用非Operator时应该经过仔细的考虑。
//Wird negatives Liberal der Form ¬Pin Regel benutzt, muss P bis dahin vollständig berechnet sein.??? S49
分层规则(Stratifiziertes Programm):
把规则根据其可表达性进行分层://再次好具体啊???
例如:
第一层:
T(X,Y):-R(X,Y)
T(X,Y):-R(X,Z),T(Z,Y)
第二层:
C(X,Y):T(X,Y),¬S(X,Y)
//是把有非操作的和没非操作的分开吗??显然没这么简单啊??
//分层有什么作用也还没搞清楚
结构图:
这里写图片描述
//这个还没经过老师的同意就上传了,算不算犯法啊
中间那个是上面规则的结构图,箭头表达了一种依赖关系,线上的“-”表示非Operator。
其中AAreaches和UAreaches为第一层规则,UAonly为第二层规则
一个正确的带有非Operator的Regel,他的结构图应该是不包含有循环的
这里写图片描述
//这是反例!!!
检测结构图是否有循环的算法思想://不是一目了然吗??
删去第二层节点,和依赖于第二层节点的节点。//还剩下有第一层的几点就说明不含有循环吧??呵呵???

SQL中得recursion

SQL-99起允许在SQL访问中使用recursion
Datalog Programm:
Reaches(x,y):-Flights(a,x,y,d,r)
Reaches(x,y):-Reaches(x,z),Reaches(z,y)
SQL-99:
WITH RECURSIVE Reaches(from,to)AS
(SELECT arm,to FROM Flights)
UNION
(SELECT R1.arm,R2.to
FROM Reaches R1, Reaches R2
WHERE R1.to=R2.frm)
SELECT * FROM Reaches;
//其实这些语法不大懂,还得补习??
//另外还有Mutual Recursion也是不懂??S57

0 0