您的当前位置:首页正文

数据仓库数据模型

2020-11-08 来源:意榕旅游网
5.2 数据仓库数据模型

5.2.1 数据组织与关系数据模型

关系模型的数据结构非常单一。在关系模型中,现实世界的实体以及实体间的各种联

系均用关系来表示。在用户看来,关系模型中数据的逻辑结构是一张二维数据表。

关系操作

关系模型给出了关系操作的能力,但不对RDBMS语言给出具体的语法要求。 关系模型中常用的关系操作包括:选择(select)、投影(project)、连接(join)、除(Divide)、并(Union)、交(Intersection)、差(Difference)等查询(Query)操作和增加(Insert)、删除(Delete)、修改(Update)操作两大部分。查询的表达能力是其中最重要的部分。

关系的三类完整性约束

关系模型允许定义三类完整性约束;实体完整性、参照完整性和用户定义的完整性。其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,体现了具体领域中的语义约束。

5.2.2 数据仓库模式结构

星型模型

星型模型是数据集市维度建模中推荐的建模方法。星型模型是以事实表为中心,所有的维度表直接连接在事实表上,像星星一样。星型模型的特点是数据组织直观,执行效率高。因为在数据集市的建设过程中,数据经过了预处理,比如按照维度进行了汇总,排序等等,数据量减少,执行的效率就比较高。

雪花模型

雪花模型也是维度建模中的一种选择。雪花模型的维度表可以拥有其他维度表的,虽然这种模型相比星型模型更规范一些,但是由于这种模型不太容易理解,维护成本比较高,而且性能方面需要关联多层维表,性能也比星型模型要低。所以一般不是很常用。

星座模型

星座模型是星型模型延伸而来,星型模型是基于一张事实表的,而星座模型是基于多张事实表的,而且共享维度信息。 通过构建一致性维度,来建设星座模型,也是很好的选择。比

如同一主题的细节表和汇总表共享维度,不同主题的事实表,可以通过在维度上互相补充来生成可以共享的维度。

5.2.3 星型模型与雪花模式

事实星座模式是数据仓库最长使用的数据模式,尤其是企业级数据仓库(EDW)。这也是数据仓库区别于数据集市的一个典型的特征,从根本上而言,数据仓库数据模型的模式更多是为了避免冗余和数据复用,套用现成的模式,是设计数据仓库最合理的选择。当然大数据技术体系下,数据仓库数据模型的设计,还是一个盲点,探索中

 数据库的模型主要用于结构化存储数据、保证数据的一致性

 数据仓库数据模型用于优化查询分析速度。数据仓库模式设计形式灵活。

因篇幅问题不能全部显示,请点此查看更多更全内容