“主数据(Master Data) 是具有共享性的基础数据, 可以在企业内跨越各个业务部门被重复使用, 比如, 可以是与客户、 供应商、 账户及组织单位相关的数据, 因此通常长期存在且应用于多个系统。 ”
主数据具有高价值、高共享、相对稳定的特性。
主数据管理是集方法、 标准、 流程、 制度、 技术和工具为一体的解决方案。
建立统一的主数据标准, 规范数据的输入和输出, 打通各部门、 各系统之间的信息孤岛, 实现企业核心数据的共享, 提升数据质量。
在企业的业务执行中, 主数据的数据重复、 数据不完整、 数据不正确等问题是造成业务效率低下、 沟通协作困难的重要因素。
例如, “一物多码”问题常常让企业的采购部门、 库房管理、 财务部门头痛不已。 实施主数据计划, 对主数据进行标准化定义、 规范化管理, 可以建立起企业对主数据标准的共同认知, 提升业务效率, 降低沟通成本。
当企业的核心数据分散在各单位、 各部门的应用系统中时, 缺乏统一的数据标准约束, 缺乏管理流程和制度的保障对于企业的集约化管理是非常不利的, 因为无法实现跨单位、 跨部门的信息共享。 企业希望加强集团管控, 实现人、 财、 物的集约化管理, 如统一财务共享中心, 共享人力资源, 集中采购等, 而部署和实施统一集中的主数据管理是其重要前提。
数字化时代, 企业的管理决策正在从经验驱动向数据驱动转型。 主数据作为企业业务运营和管理的基础, 如果存在问题将直接影响企业的决策, 甚至误导决策。 实施有效的主数据计划, 统一主数据标准, 提高数据质量, 打通部门、 系统壁垒, 实现信息集成与共享, 是企业实现数据驱动、 智能决策的重要基础。
摸清企业现状,梳理企业现有主数据和数据管理程度。
建立主数据组织体系、数据标准体系、制度与流程体系、主数据技术体系、主数据安全体系。
主数据管理实操阶段。
包含数据接入、数据清洗和数据应用三个阶段。
主数据接入是将主数据从数据源系统接入并汇集到主数据平台的过程。 该过程用到的技术有很多, 常见的有ETL抽取、 文件传输、 消息推送、 接口推送等。
主数据清洗工作包含期初数据的收集整理和遗留系统历史数据的处理, 需要提前制定主数据清洗方案, 以指导主数据的清洗工作。
主数据清洗方案主要涵盖以下内容:
主数据清洗操作包括主数据归类、 主数据去重、 缺失值处理、 规范性描述等。
主数据分发即将标准化的主数据分发给下游业务系统使用的过程。 主数据分发过程的各系统厂商都应按照《主数据集成规范》 约定的集成方式、 接口标准、 注意事项进行对接。
在企业实施主数据分发的过程中, 需要根据不同场景选择不同的集成方式。
主数据分发对消费系统的要求如下。
对主数据的日常管理、质量管理等进行管理。
数据分类是指出于某种目的, 在指定范围内, 以一定的分类原则和方法为指导, 按照信息的内容、 性质及管理者的使用要求等, 将信息按一定的结构体系分门别类地组织起来, 并建立起一定的分类体系和排列顺序。
主数据的基本分类方法有三种, 即线分类法、 面分类法和混合分类法, 其中线分类法又称层级分类法, 面分类法又称组配分类法。
分类法将要分类的对象按其所选择的若干个属性或特征, 按最稳定本质属性逐次分成若干层类目, 并排列成一个层次逐级展开的分类体系。
面分类法是指将所选定分类对象的若干标志视为若干个面, 将这些面划分为彼此独立的若干个类目, 排列成一个由若干个面构成的平行分类体系。
混合分类法是在已有的分类中, 同时使用线分类和面分类两种方法进行分类, 以满足业务的需要。 混合分类一般以一种分类方法为主, 将另一种作为补充。 例如: 在上面的示例中, 我们可以用线分类法作为企业电子元器件的主分类, 将面分类中的“安装工艺”和“可靠性”作为电子元器件的辅助分类属性进行管理, 以满足信息查询和业务使用的需要。
主数据编码是为了方便主数据的标识、 存储、 检索和使用, 在进行主数据处理时赋予具有一定规律、 易于计算机和人识别处理的符号。
编码是个技术活。
《GB/T 7027—2002信息分类和编码的基本原则与方法》 给出了两种编码方法, 分别是有含义的代码和无含义的代码。
在实际的主数据编码中, 通常会将两者结合起来。 基于大、 中、 小类的层次码进行编码很有必要, 这样便于归类和检索, 但一般不建议分得太细, 例如把物料、 规格、 型号等都考虑进去就没有太大的意义。
基于分类的主数据编码规则如下:
**
主数据编码颗粒度主要是指主数据管理的属性数量及管理属性值的大小程度, 它决定了主数据编码量的多少。
一般来说, 主数据编码必须包含核心特征属性, 而普通特征属性和附加特征属性可根据管理的目的进行取舍。 选择的普通特征属性越多, 则主数据编码的颗粒度就越细, 编码量就越大。 而选择几个、 选择哪些特征属性与主数据编码绑定, 这涉及企业的销售管理、 成本管理、 生产管理等业务, 应根据企业的业务需求和目的而定。
主数据集成主要包括两个方面:
第一, 主数据平台与权威数据源系统的集成, 实现主数据从权威数据源的采集并装载到主数据平台中;
第二, 主数据平台与主数据消费系统的集成, 将标准的主数据代码按照约定的集成方式分发到主数据的消费系统中。
可以通过API采集、库表拉取的方式。
可以通过API发布、库表推送的方式。
定好目标,对目标进行拆分,一个一个的完成。
总结:总体规划、分步实施
主数据管理绝对不是为了做主数据而做主数据, 而是为了服务于企业的业务目标。 主数据项目建设不是一个部门的任务, 也不只是IT部门的事情, 需要技术和业务协同, 为实现企业的业务目标而服务。 主数据项目建设需要业务驱动和技术引领的双引擎。
主数据编码是保证数据的唯一性、 一致性的关键属性。 编码的目的在于将数据编码化繁为简, 便于主数据的管理, 如果编码过于繁杂, 则违反了编码的目的。 通常情况下, 会使用系统自动生成的流水码来作为主数据的编码, 用于机器识别, 重点解决的是异构系统之间的数据映射问题。
数据清洗, 从字面上理解就是把脏数据洗掉, 这里“脏数据”是指重复、 不一致、 不完整、 不正确的数据。 数据清洗是发现并纠正数据集中数据质量问题的过程, 包括检查数据唯一性、 一致性, 处理重复数据和缺失值等。
主数据管理系统
主数据管理工具用来整合来自不同来源的数据, 使企业能够为重要数据创建单一数据源, 统一数据视图, 从而提供标准、 准确、 一致的核心数据, 帮助企业做出明智的决策。 在应用层面, 主数据管理工具自下而上可分为业务系统层、 主数据集成层、 主数据管理层和主数据应用层四层架构,
主数据建模功能是主数据管理的基础, 主数据的申请、 审核、 质量、 安全、 集成共享等功能都是围绕主数据模型展开的。
主数据建模包括主数据分类、 主数据编码、 主数据属性模型、 主数据界面模型及主数据审批模型。
数据管理工具提供创建、 使用、 管理和监控主数据功能, 使用健全的工作流和审批功能, 支持企业范围的数据治理政策和流程, 并通过严格的管理流程, 实现主数据申请、 审核、 变更、 冻结和归档等全生命周期管理, 让业务用户能够访问统一、 可靠的主数据。
需要制定相应的主数据申请流程、审核节点、变更流程、冻结流程和归档流程。
主数据管理工具提供主数据质量规则设计、 主数据质量稽核、 主数据质量报告、 主数据问题处理等功能, 实现主数据质量从问题发现到问题处理的闭环管理。
主数据管理工具提供用户身份认证、 细颗粒度的权限控制、 分级授权、 安全审计、 数据签名、 敏感数据脱敏/加密等功能, 以保证主数据管理的应用安全、 接口安全和数据安全。
主数据管理工具提供数据库集成、 消息集成、 Web服务集成等多种主数据集成方式, 可灵活实现全量/增量数据与异构系统的交互, 实现主数据整合和分发。