数据元(Data Element)的理解
一、什么是数据元?
数据元 是数据治理中最基础的单元,可以理解为不可再分的数据单元 ,是描述事物某一属性的最小数据单位。
通俗理解 :如果把数据比作一栋楼,数据元就是一块砖 。
二、生活化举例
以“员工信息表”为例:
| 数据元 | 含义 | 示例值 |
|---|---|---|
| 员工姓名 | 员工的真实姓名 | “张三” |
| 性别 | 员工性别 | “男” |
| 出生日期 | 员工出生年月日 | “1990-01-01” |
| 身份证号 | 公民身份号码 | “110101199001011234” |
| 入职日期 | 员工开始工作的日期 | “2020-06-01” |
每一个字段都是一个数据元 ,它们共同描述“员工”这个实体。
三、数据元的标准结构
一个完整的数据元定义包含三要素:
| 要素 | 说明 | 示例 |
|---|---|---|
| 对象 | 描述的事物 | 员工 |
| 特性 | 事物的属性 | 入职日期 |
| 表示 | 数据的格式/类型 | DATE类型,格式YYYY-MM-DD |
示例 :
- 对象:员工
- 特性:入职日期
- 表示:日期型,格式 YYYY-MM-DD
- 完整表述 :员工入职日期 = 2020-06-01
四、数据元的作用
| 作用 | 说明 |
|---|---|
| 统一口径 | 避免“生日”“出生日期”“出生年月”混用 |
| 规范格式 | 统一日期格式、编码规则等 |
| 跨系统互通 | 不同系统用同一个数据元,数据才能对得上 |
| 数据质量基础 | 没有清晰的数据元定义,就无法衡量数据质量 |
五、数据元 vs 相关概念
| 概念 | 关系 |
|---|---|
| 数据元 | 最基础的原子单元 |
| 元数据 | 描述数据的数据(数据元是元数据的一种) |
| 主数据 | 核心业务实体的数据(由多个数据元组成) |
一句话总结 :数据元是数据治理的“基本单位” ——先定义清楚每个数据元是什么、怎么表示,才能保证全公司的数据口径一致、可理解、可交换。