分析步骤简介
1. 概述
1.1 应用场景
创建好分析后,就可以添加步骤进行分析了。用户可以对当前表数据进行加工处理,包括数据清洗、数据处理、数据整合等,从而实现多维度分析。
此外,经过加工处理的当前表数据,可以继续创建子表,子表可以基于当前表中步骤的结果数据进一步分析。
1.2 功能简介
分析表布局大致如下:
- 红色区域:添加分析步骤分析,添加图表等;
- 绿色区域:分析步骤设置区域;
- 黄色区域:数据预览区域。
2. 字段类型介绍
在分析表中,有多种字段类型:数值类型、高精度数值类型、文本类型、日期类型。其中「日期类型」又可以分为:年月日、年周数、年月...等等的格式。
2.1 数值类型&文本类型
字段类型 | 标识 | 示例 |
数值类型 | 以二进制形式存储和计算,浮点数在表示某些小数时可能会出现精度损失 | |
高精度数值类型 | 以十进制形式存储和计算,可存储固定 35 位有效数字:20位整数 + 15位小数,满足高精度计算场景 | |
文本类型 |
2.2 日期类型
1)日期类型包含:年月日时分秒、年月日、年周数、年月、年季度、年周期、月日,标识如下图所示:
2)特别说明「年周期」,可以自定义起始日期以及周期,以分类汇总步骤为例,拖入一个日期字段,下拉选择「年周期」,如下图所示:
3)可以在弹窗中设置「某一周期的第一天」和「周期」,比如设置设置 2023-01-01 为周期的第一天,两周为一个周期。在后面可以用自定义的周期计算同比或者环比。如下图所示:
3. 编辑数据
可添加的分析步骤如下:
功能 | 场景/功能 |
分类汇总 | 先对数据进行分组,然后对分组后的数据进行汇总计算,还支持按条件汇总数据。 |
新增字段 | 在不影响已有字段的情况下,利用已有字段可以计算得到新的一列。 |
替换字段 | 会影响已有的字段,利用已有的字段得到计算列会替换之前的列 |
字段类型转换 | 修改字段类型 |
选字段 | 选择某些字段参与分析 |
合并表 | 将多张表的字段左右拼接到一起最后变成一张宽表 |
将多张表上下拼接成一张表 | |
行列转换 | 行列转换可以将在一维表和二维表之间相互转换。 |
拆分行列 | 可以将字段值拆分到不同的列或者不同的行 |
删除重复数据 | 去除脏数据,支持自定义去重字段 |
补全缺失值 | 可以设置补全缺失的数据 |
4. 分析步骤预览
若当前步骤数据结果小于5000行,可实时预览数据结果。当前步骤数据结果大于5000行,修改分析步骤配置时,需要手动点击「点击预览最新数据」按钮。
4.1 调整预览区域大小
数据较多的时候,可以手动调整预览区域的大小,方便查看,查看完之后再收起继续做分析。如下图所示:
5. 在选字段步骤突出当前表实际用到的字段
在制作分析表时,在「来源表」步骤中突出当前表实际使用到的字段,方便其他成员查看该分析表时知道当前分析表使用的字段有哪些。
当前分析表实际使用到的字段栏背景颜色会深一些,如下图所示:
6. 数据量限制
6.1 数据行数限制
当前只控制了原始表的行数,但是原始数据上下合并多个表,左右合并的笛卡尔积,拆行这些操作都会使数据行数膨胀。因此,增加对分析表结果行的控制,并结合原始表对行数限制。
计算超限包括两部分:
- 分析步骤数据结果超过 1000 万行限制,将无法继续操作,请添加「筛选」或者「分类汇总」等操作减少行数
- 更新时步骤计算的超限 :父表更新导致子表超限,更新到子表对应的步骤计算会给出超限提示。
6.2 数据列数限制
分析步骤数据结果超过 400 列限制,将无法继续操作,请减少步骤使用字段数或者在之前的步骤中使用分类汇总等步骤减少列数。
同理,图表中每个字段框的字段数也有 400个限制,为避免列数过多导致加载时间长,请限制列数的使用。