本文转自:中国发展网导读:为适应时代发展脚步|数据治理前,企业如何自查数据质量( 二 )
2.从数据自身的角度自查数据质量
遵守数据质量自查标准即可 , 见图一:
文章图片
图一自查数据质量的方法(数据角度)
3.从业务管理和数据应用分析的角度判断数据质量
文章图片
4.数据自查具体步骤
1)明确目标 , 有针对性开展评估
评估的最终目标是为了使数据质量更好地满足业务的需求 。 所以首先应该明确业务对各类数据的各种要求 , 有针对性地对各类数据进行评估 。
2)根据业务需求 , 确定评估细节
对于不同类别的数据 , 要根据当前的目标和需求选取不同的评估维度 , 设立不同的评估标准 , 对同一数据的不同生命周期也是如此 。 最终 , 可以根据各种细节确立一套合理高效的评估体系 , 归入日后的数据管理常规性工作中 。
3)实施评估 , 合理选择方式方法
在实施评估的过程中 , 应该根据不同数据的特点 , 选择对应的测度 , 运用合理的方式方法 , 多维度结合考量 , 保证评估结果的准确性 。
4)结果分析
作为数据治理项目实施的重要依据 , 在撰写数据质量评估报告时 , 应从企业的角度对评估结果进行合理分析 , 给出确定的结论和目标需求 , 有效指导后续的工作 。
5.数据质量自查实例
【案例一】数据规范、标准问题:国内某大型箱包生产企业集团 。
1)编码数据模型不统一、不标准 , 如表一所示:
文章图片
分析:通过以上数据可以看出 , 不同编码的规格型号的描述方式相差较大 , 有纯汉字说明和借用编码流水号两种 , 二者的共存很容易导致一物多码或一码多物的问题发生 , 因为不一样的描述方法 , 业务系统无法验证新增数据时的重复所在 。 且物资描述不标准、不清晰 , 规格型号用编码来代替 , 新员工难以快速理解 , 容易导致错误采购、错误生产、错误盘点等现象的发生 , 对业务产生负面影响 。
2)规格型号书写格式不规范 , 如表二所示:
文章图片
分析:规格型号的描述中“织唛”前有的有空格 , 有的没有空格 , 这种现象的出现直接导致现有业务系统无法实现有效查重 , 出现重码现象在所难免 。
【案例二】数据冗余问题:国内某大型装备制造企业集团 。
企业的数据规范和标准长期由人工执行 , 以及数据新增时的人为查重、人为监管等 , 导致了主数据层面“一物多码”的大量存在 , 产生了大量的主数据冗余 。
1)书写格式不规范 , 出现了大小写(同一小类)不统一的情况 , 如表三所示:
文章图片
分析:表三的编码中 , 编码属性模板还是比较标准的 , 但是在实际录入过程中出现了大小写不一致的问题 , 如最后三条编码规格中用的是小写 , 往上三行是大写 , 再往上又有小写出现 , 这很明显地说明了缺乏严格的数据验证制度 , 所以编码重复在所难免 。
2)很明显的数据冗余(同一小类内一物多码) , 如四所示:
文章图片
(山东中翰软件有限公司)
- 推进能源转型,电力为何关键?
- 本文转自:人民邮电报①小朋友们兴致勃勃地体验“3D巧克力打印”技术。|中国电信携多款明星产品亮相世界 5G 大会
- 你所不知道的Bose
- 本文转自:哈尔滨日报“5G与碳达峰碳中和论坛”现场。|挖掘5G绿色潜能 赋能“双碳”目标
- 本文转自:深圳新闻网国际无人机足球锦标赛激战正酣。|探访第七届深圳国际无人机展 无人机足球赛居然这样玩
- 本文转自:国际在线8月11日|GPOWER2022动力展在南京举办
- 6g|美国率先突破6G技术!中国院士发出警告,国运之争不可轻视!
- 本文转自:人民网人民网北京8月12日电 (记者杜燕飞)记者从国家能源集团获悉|拓宽柔性支架应用场景 国内首个屋顶柔性支架光伏项目并网发电
- 中国航天科技|转入首飞试验阶段
- 三星|联想或将被抛弃!中国采购5000万台“纯国产”电脑