Power BI 数据模型——创建表间关系
发布时间:2024年01月17日
1、为什么要建立表间关系
- 表之间的关系是数据模型的核心,它允许跨表进行数据分析。
- 在A和B两个表之间建立关系后,才能用A表的字段去筛选或聚合B表中数据,反过来也是一样。
2、创建关系的方式
- 自动检测:Power?BI在加载数据时会尝试自动检测和创建关系。(但这种关系创建往往是直接在不同表的同名字段间创建关系,不一定是我们想要的关系,还可能会导致后续数据分析的错误。因此需要进行检查和调整)
- 手动创建:在“模型”视图中,可以通过拖拽来手动建立或调整表之间的关系。
3、关系类型:一对一、一对多、多对多
- 两个表的对应关系,关系是有次序的,分为左表和右表,两个表之间有多对一、一对一、一对多和多对多四种关系,具体说明如下。
- 多对一(*:1):这是最常见的类型,代表左表中的关系列有重复值,而在右表中是单一值。通常左表是事实表,右表是维度表。
- 一对一(1:1):左表和右表关系列中的值都是唯一的。不建议使用,因为如果两个表之间是一对一的关系,那更好的方法是把这两个表合并成一个。
- 一对多(1:*):与多对一正好相反。
- 多对多(*:*):左表和右表关系列中均有重复值,尽量避免使用这种关系.
事实表 | 维度表 |
包含观测或事件数据值,例如订单表 | 包含事实表中数据相关的描述性信息,如产品表 |
事实数据表可以包含多个重复值,例如日期、产品、用户等都会重复出现 | 维度表必须包含一个非重复维度列 |
事实表通常较大 | 维度表通常较小,受限于可以筛选和分组的项数。例如,日期表、地区表的项数都是有限的 |
数据表用于执行数学运算,将数据用于聚合(SUM、AVERAGE、MIN、MAX) | 维度表用于对事实数据表中的数据进行筛选和分组 |
以日期和数字为主,如销售额、数量和价格之类的量化数据 | 内容以文本为主,如产品、地区、日期等 |
较高的更新频率 | 较低的更新频率 |
4、交叉筛选方向
- 单向交叉筛选:关系中只有一个表可用于筛选数据。例如,表?1?可以按表?2?进行筛选,但表?2?不能按表?1?进行筛选。筛选方向由关系箭头方向确定。通常是一对多单向交叉筛选,即用一端的表(通常是维度表)去筛选多端的表(通常是事实表)。
- 双向交叉筛选:关系种的两个表,都可以用来筛选另一个表的数据。例如,可以通过事实数据表筛选维度表,也可以通过维度表筛选事实数据表。
- 一般不建议使用双向交叉筛选关系(除非你真的需要,而且很清楚它会造成的效果),启用它可能导致多义性、意外结果以及性能降低。
5、活动状态和非活动状态
- 表之间可以存在多个关系,但同时只能有一个关系处于活动状态(在模型关系图中用实线表示),其他的关系则处于非活动状态(用虚线表示)。
6、创建关系的要求
- 尽量避免多对多关系。
- 尽量避免双向关系。
- 避免在数据表之间创建关系。
文章来源:https://blog.csdn.net/Sun_Weiss/article/details/135633655
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:chenni525@qq.com进行投诉反馈,一经查实,立即删除!