数据诊断报告
1. 概述
1.1 应用场景
用户在对合并了多张表进行销售情况分析后,制作了一张汇总情况图表,但是发现某个店铺的销售额非常低。该用户可以对这条数据进行标记,分别溯源参与该字段计算的所有字段,再根据标记数据排查异常值。
但是这样的追溯会花费很多时间,希望可以快速定位到原始数据,以确认是否是原始数据填写错误。或者是不是「左右合并」步骤中出现了重复数据导致数据计算错误。
1.2 功能简介
用户在查看数据或者图表时,可以对异常数据进行诊断,会自动一张故事板。故事板包含以下两个部分的内容:
1)系统会自动溯源找到该数据计算涉及到的原始数据,判断原始明细数据是否存在空值、错误值,可通过数据概览视图查看数据质量情况;
2)若当前诊断数据的来源数据经过左右合并步骤,且该合并步骤中存在重复数据。在故事板中将展示参与诊断数据计算的数据行,方便排查是都是重复数据造成数据膨胀,导致数据计算错误。
2. 示例一
2.1 触发诊断
1)在对销售数据进行分析时,计算出了品牌的利润,发现有一个品牌的利润是负的。想要查看一下原始数据的质量,是否存在错误值。如下图所示:
2)右击这行数据,点击「数据诊断」。如下图所示:
2.2 诊断结果
1)系统会自动生成一张故事板,溯源定位到该数据计算涉及到的原始数据。
比如我这里的 O.C.T.MAMI(十月妈咪)的「利润」是由销售明细表中的「毛利」及「销售额」字段中的部分数据计算得出的。
2)点击「展开」按钮,可以查看当前计算数据的数据明细及数据概览视图。在视图中可以排查是否是原始数据的录入出现了问题。如下图所示:
3)通过排查,可以发现毛利的最大值出现了异常,得出的结论是 2017 -9-30 号这天有一天数据录入错误。后续进行修正即可。如下图所示:
3. 示例二
若当前诊断数据的来源数据经过左右合并步骤,且该合并步骤中存在重复数据。
在故事板中将展示参与诊断数据计算的数据行,方便排查是否是重复数据造成数据膨胀,导致数据计算错误。
3.1 触发诊断
1)在计算 3 月各员工的打卡情况,发现有一名员工的打卡次数有 46 次,数据出现了问题,对这行数据进行诊断。如下图所示:
3.2 诊断结果
1)在查看诊断数据的来源明细时,发现人员信息表中「丁童」的信息出现了两次,原始数据出现录入重复错误;
2)当前诊断数据经过「左右合并 」步骤,且在合并步骤中存在重复数据。第二部分展示左右合并步骤中,关于「丁童」数据的计算行。如下下图所示:
3)通过数据概览视图,可以发现打卡次数都是重复的。由于原始数据的重复,导致左右合并时数据出现膨胀。如下图所示:
4)因此,我需要修改「人员信息表」,去重「丁童」的重复数据行,这样数据就可以计算正确了。