Summary
系统阐述工业数据质量的六大维度(完整性、准确性、一致性、及时性、唯一性、有效性),典型质量问题场景(传感器死值/跳变/漂移、数据缺失、时间漂移、单位不统一、编码不一致),三类检测方法(规则引擎、统计检测、AI检测),以及五步质量治理闭环流程(检测-标记-隔离-修复-验证)和质量评分模型。
Key Claims
- 数据质量六大维度:完整性(25%权重)、准确性(25%)、及时性(20%)、一致性(15%)、唯一性(10%)、有效性(5%)
- 传感器是最常见的质量问题的来源:死值(持续上报同一值)、跳变(瞬时异常值)、漂移(精度下降)
- 检测方法分三层:规则引擎(阈值/格式/逻辑规则)、统计检测(3sigma/箱线图/变化率)、AI检测(Isolation Forest/AutoEncoder/时序异常检测)
- 质量治理五步闭环:检测(Detect)→ 标记(Tag)→ 隔离(Isolate)→ 修复(Repair)→ 验证(Verify)
- 实施建议:抓主要矛盾(优先影响OEE和良率的数据),源头治理(在采集层解决),业务参与
Connections
- 工业数据治理框架 — 数据质量是治理框架中最核心的主题
- 数据采集层架构 — 采集层的源头质量控制是数据质量的第一道防线
- 实时数据流水线 — 质量检测嵌入实时流水线,在流处理环节进行实时检测
- 数据血缘与元数据管理 — 质量问题在血缘图上标注,实现影响分析
- 工厂主数据管理 — 编码不一致是典型的数据质量问题
- DataGovernance — 数据质量管理是数据治理的核心组成