Microsoft2000作为“矢量友好系统”

来源:互联网 发布:淘宝哪家珠子是真货 编辑:程序博客网 时间:2024/04/30 01:06
<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 160x600, 创建于 08-4-23MSDN */google_ad_slot = "4367022601";google_ad_width = 160;google_ad_height = 600;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
JoyMundy
MicrosoftCorporation
2001年1月

 

摘要:本文针对RalphKimball定义的矢量友好系统的二十个标准介绍了MicrosoftSQLServer2000数据仓库技术。

目录

概述体系结构管理标准表达式标准总结更多信息尾注

概述

本文按照由RalphKimball(1)定义的“矢量友好系统”的二十个特性介绍了Microsoft®SQLServer™2000数据仓库框架的功能和特性。介绍这些特性旨在提供“能使系统的矢量化程度提高或降低的好方法”(2)。

Microsoft数据仓库框架对创建、使用和管理数据仓库进程中的各种组件之间的关系作了说明。数据仓库框架包括创建数据仓库使用的组件:关系、元数据服务、数据转换服务、分析服务、OLEDB和英文查询。数据仓库框架的评级为91%,即在适用于参评系统的19.5分中获得了17.8分:

SQLServer2000EnterpriseEdition中的矢量关系数据仓库。

使用SQLServer2000数据转换服务(DTS)填充。

SQLServer2000EnterpriseEdition分析服务立方体,典型情况下与矢量关系数据仓库(DW)(特例在文中指出)大小相同。立方体也具有所有客户可以使用的预定义计算(计算标量、命名集合、自定义集合和计算单元)。

立方体使用DTS立方体填充任务进行填充。

因为SQLServer2000是开放平台,支持大量第三方访问工具,因此本文不明确考虑特定的最终用户工具。多数“查询”问题是从分析服务查询语法是否支持构造的角度进行解答的,而非是否有工具可以这样做。极个别问题直接涉及用户经验(最终用户可在屏幕上看到的内容),这样的问题已标记为“N/A”。

本文围绕Kimball的二十个特征展开。每一部分阐明了Kimball对特征的定义,总结了Microsoft解决问题的方法,并通过逐步得分反映了体系结构是如何满足其要求的。标有“特征”的章节摘自上述Kimball的文章;这两篇文章可以在http://www.intelligententerprise.com/000428/webhouse.shtml(英文)和http://www.intelligententerprise.com/000515/webhouse.shtml(英文)上找到。表格包括在Kimball的“矢量友好系统的二十个标准”(原稿即将发行)中出现的特性和特性权值。

体系结构

1.显式声明
分值=1.0

特征1:系统提供显式数据库声明,以区分标量(事实)实体和矢量实体。这些声明存储在系统元数据中。管理员和最终用户可以看到这些声明,且这些声明影响查询策略、查询性能、分组逻辑和物理存储。事实可以声明为全加、半加和非加。默认的(自动)聚合技术(而非汇总)与事实相关联。在元数据中声明了矢量和事实间的默认关联,这样,用户可以不指定它们之间的链接。查询中包含的矢量属性自动成为动态聚合的基础。默认情况下,查询中包含的事实在所有聚合的范围内求和。禁止半加事实和非加事实在错误的矢量中进行求和。

分析服务立方体用矢量和标量的显式声明进行定义。默认的标量(求和、计数、求最小值、求最大值和独特计数)聚合技术在立方体进程中指派。立方体定义中的自定义集合为加、半加和非加事实提供了非常灵活的实现方法。立方体结构为最终用户提供了矢量和事实之间的所有无缝联接。

符合?特性权值(3)特性

2.矢量一致性
分值=0.9

特征2:系统使用一致的矢量以实现交叉查询,其中来自不同数据库、不同位置、不同技术的应答集合通过匹配一致性矢量所提供的行标头,可以组合为更高级的应答集合。如果试图使用未经确认的事实,系统将检测并警告。这是最基础和最根本的体系结构标准。此标准是实现分布式数据仓库的基础,特别是那些通过Web共享数据的分散于各地的组织(没有中心)所构成的Web库。1

<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 728x15, 创建于 08-4-23MSDN */google_ad_slot = "3624277373";google_ad_width = 728;google_ad_height = 15;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
<script type="text/javascript"><!--google_ad_client = "pub-2947489232296736";/* 160x600, 创建于 08-4-23MSDN */google_ad_slot = "4367022601";google_ad_width = 160;google_ad_height = 600;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>