数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。
为什么我们已经有数据库,还要建立数据仓库及其相关概念?是因为数据仓库能够更好解决我们遇到的实际问题,可以帮助我们多维度,多系统,多层次分析问题。下面是数据仓库的几个优势点。
1.决策更加科学合理
2.数字资源有效整合
3.数据质量准确一致
4.提高业务系统性能
我们对比一下传统的数据库和数据仓库。数据仓库是专门为数据分析设计的,涉及读取大量数据以了解数据之间的关系和趋势。数据库用于捕获和存储数据,例如记录事务的详细信息。
数仓一般分为ODS、DM、ADS层。其中ODS是数据运营层(明细层),来自各个原始系统,DW是数据仓库层,这里会把数据按照不同主题进行分类汇总,ADS是数据应用层,将数据按照不同主题汇总整理后,供报表等系统使用。
数据仓库一般使用Hive等数据仓库工具,这就和大数据开发很好的结合在一起,如果有兴趣可以关注一下大数据相关系列的文章。
大数据相关:https://blog.csdn.net/helongqiang/category_11192328.html
数据仓库的使用范围很广,凡是涉及到数字化转型的企业都会涉及此项工作,比如互联网公司的数据部门,政府的数字政府建设,传统企业的数字化转型等。数仓方面的工作大概有数据开发工程师、大数据开发工程师、数据仓库工程师、数据分析工程师等。
如有侵权请联系我删除。
如果您觉得此文对您有帮助,请点赞、关注、收藏。祝您生活愉快!