本文章主要介绍ETL和大数据中涉及到名词,同时解释这些名词的含义。由于不是一次性收集这些名词,所以这篇文章将会持续更新,更新日志会存放在本段话下面:
12-19更新:OLTP、OLAP、BI、ETL。
中文称呼:在线事务处理系统。
主要功能:对数据进行增删改查,特性是事物的吞吐量。面向的业务主要涉及到的是常用的软件信息存储等等。
中文称呼:联机分析处理系统。
主要功能:偏向于数据的查询,特性是查询效率。面向的主要是决策分析,关键数据提取汇总等等。
中文称呼:商业智能(常常听见过BI报表开发有没有?)
主要功能:使用ETL清洗数据,整合数据仓库,提取数据,完成数据的展现,打破信息壁垒。换个角度来说,BI更像是ETL+数仓+其他技术的一个综合体。
中文称呼:数据清洗(E:抽取+T:转换+L:加载)
主要功能:将数据从OLTP系统中转移到数据仓库中的一系列操作的集合。