Power BI 数据模型——创建表间关系

发布时间:2024年01月17日
1、为什么要建立表间关系
  • 表之间的关系是数据模型的核心,它允许跨表进行数据分析
  • 在A和B两个表之间建立关系后,才能用A表的字段去筛选或聚合B表中数据,反过来也是一样。

2、创建关系的方式
  • 自动检测:Power?BI在加载数据时会尝试自动检测和创建关系。(但这种关系创建往往是直接在不同表的同名字段间创建关系,不一定是我们想要的关系,还可能会导致后续数据分析的错误。因此需要进行检查和调整)
  • 手动创建:在“模型”视图中,可以通过拖拽来手动建立或调整表之间的关系。

3、关系类型:一对一、一对多、多对多
  • 两个表的对应关系,关系是有次序的,分为左表和右表,两个表之间有多对一、一对一、一对多和多对多四种关系,具体说明如下。
    • 多对一(*:1):这是最常见的类型,代表左表中的关系列有重复值,而在右表中是单一值。通常左表是事实表,右表是维度表
    • 一对一(1:1):左表和右表关系列中的值都是唯一的。不建议使用,因为如果两个表之间是一对一的关系,那更好的方法是把这两个表合并成一个。
    • 一对多(1:*):与多对一正好相反。
    • 多对多(*:*):左表和右表关系列中均有重复值,尽量避免使用这种关系.

事实表

维度表

包含观测或事件数据值,例如订单表

包含事实表中数据相关的描述性信息,如产品表

事实数据表可以包含多个重复值,例如日期、产品、用户等都会重复出现

维度表必须包含一个非重复维度列

事实表通常较大

维度表通常较小,受限于可以筛选和分组的项数。例如,日期表、地区表的项数都是有限的

数据表用于执行数学运算,将数据用于聚合(SUM、AVERAGE、MIN、MAX)

维度表用于对事实数据表中的数据进行筛选和分组

以日期和数字为主,如销售额、数量和价格之类的量化数据

内容以文本为主,如产品、地区、日期等

较高的更新频率

较低的更新频率

4、交叉筛选方向
  • 单向交叉筛选:关系中只有一个表可用于筛选数据。例如,表?1?可以按表?2?进行筛选,但表?2?不能按表?1?进行筛选。筛选方向由关系箭头方向确定。通常是一对多单向交叉筛选,即用一端的表(通常是维度表)去筛选多端的表(通常是事实表)。
  • 双向交叉筛选:关系种的两个表,都可以用来筛选另一个表的数据。例如,可以通过事实数据表筛选维度表,也可以通过维度表筛选事实数据表。
    • 一般不建议使用双向交叉筛选关系(除非你真的需要,而且很清楚它会造成的效果),启用它可能导致多义性、意外结果以及性能降低。

5、活动状态和非活动状态
  • 表之间可以存在多个关系,但同时只能有一个关系处于活动状态(在模型关系图中用实线表示),其他的关系则处于非活动状态(用虚线表示)。

6、创建关系的要求
  • 尽量避免多对多关系。
  • 尽量避免双向关系。
  • 避免在数据表之间创建关系。
文章来源:https://blog.csdn.net/Sun_Weiss/article/details/135633655
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。