《实体解析与信息质量》-1.2.7 复习题

来源:互联网 发布:电子海报制作软件 编辑:程序博客网 时间:2024/06/11 09:27

复习题

1.       ER的定义,明确提及“真实世界”的实体。解释下为什么你认为这是很重要的。举些不真实的实体的例子。

2.       在某些数据库系统中,一个实体的主键可以是由有多个属性组成的复合键。列举一些实际的例子。论述组合键和单一键的各自的利弊。

3.       比较下实体关系模型和新的对象建模技术,如统一建模语言(UML)。

4.       对于Maydanchik意味着数据衰减,像是数据源的质量问题,你有什么看法。它是如何不同于其他来源的数据质量问题的。

5.       在产品识别的案例中,主要的产品表通常标识一个特定类型的产品。另一方面,一个库存系统会跟踪每一个产品,即使是相同的产品。论述设计一个ER系统在各种这些情况的注意事项。在这些情况下哪些是实体。实体引用又是什么样的。在什么情况下用这个会是更好而不是另一个。

6.       ER在维护病人医疗记录中是很重要的。假设一个ER系统在医院做一些假阴性和假阳性链接的判断。给一些这样的例子,可能的不良患者的治疗结果.

7.       计算标准化的levenstein编辑距离,最大q-Gram,调整的q-Gram四面体比率,Jaro比较器,Jaro-Winkler比较器,Soundex下面每一对字串:(“NICK”,“NICHOLAS”),(“MICHELLE”,“MITCHELL”),(“MUHAMMAD”,“MOHAMMAD”),(“CHARLES”,“CHARLISE”),和(“JOHNSON”,“JOHNSTON”)。

8.       论述引用链接和引用等价之间的区别。

9.       设计一个客户实体间的关联配置,关联不等价但关联的配置可以导致一个等价的决议。

10.   论述合并清除ER系统和身份捕捉ER系统的区别。

11.   论述身份ER识别系统和身份捕捉ER系统的区别。

12.  论述链接引用和传递等价还有关联分析之间的区别和联系。

13.   为客户实体确定至少5种公共来源和五个商业的断言等价信息来源。

14.   给一个在刑事调查中的真实或虚构场景,说明ER已经或可能发挥重要作用。

0 0