数据治理里面的数据元通俗理解

数据元(Data Element)的理解

一、什么是数据元?

数据元 是数据治理中最基础的单元,可以理解为不可再分的数据单元 ,是描述事物某一属性的最小数据单位。

通俗理解 :如果把数据比作一栋楼,数据元就是一块砖

二、生活化举例

以“员工信息表”为例:

数据元 含义 示例值
员工姓名 员工的真实姓名 “张三”
性别 员工性别 “男”
出生日期 员工出生年月日 “1990-01-01”
身份证号 公民身份号码 “110101199001011234”
入职日期 员工开始工作的日期 “2020-06-01”

每一个字段都是一个数据元 ,它们共同描述“员工”这个实体。

三、数据元的标准结构

一个完整的数据元定义包含三要素:

要素 说明 示例
对象 描述的事物 员工
特性 事物的属性 入职日期
表示 数据的格式/类型 DATE类型,格式YYYY-MM-DD

示例

  • 对象:员工
  • 特性:入职日期
  • 表示:日期型,格式 YYYY-MM-DD
  • 完整表述 :员工入职日期 = 2020-06-01

四、数据元的作用

作用 说明
统一口径 避免“生日”“出生日期”“出生年月”混用
规范格式 统一日期格式、编码规则等
跨系统互通 不同系统用同一个数据元,数据才能对得上
数据质量基础 没有清晰的数据元定义,就无法衡量数据质量

五、数据元 vs 相关概念

概念 关系
数据元 最基础的原子单元
元数据 描述数据的数据(数据元是元数据的一种)
主数据 核心业务实体的数据(由多个数据元组成)

一句话总结数据元是数据治理的“基本单位” ——先定义清楚每个数据元是什么、怎么表示,才能保证全公司的数据口径一致、可理解、可交换。

1 个赞

好解释

1 个赞