排名
1. 简介
1.1 功能简介
排名是指按照某种规则对数据进行排序,并将其分配一个排名序号的过程。
数据工厂中的排名数据将以新增列的形式添加至数据列表中,新增的数据列为数值类型。
1.2 应用场景
在数据分析中,排名通常用于比较和评估数据中的不同变量之间的差异。排名可以按照升序或降序进行排序,以便确定每个数据值在整个数据源中的位置。数据排名可以帮助分析人员发现数据中的异常值、趋势和模式,并为决策提供有用的信息。
如,销售员业绩排名、学生成绩按【班级】分组排名等。
1.3 预期效果
下图为同一年级两个班级的学生在各自班级中的成绩排名情况:
2. 设置步骤
下面以学生成绩按「班级」排名为例,进行操作讲解。
2.1 新建数据流
在数据工厂功能入口处「新建数据流」,如下图所示:
2.2 选择数据源
选择需要进行排名的数据源表单:
2.3 添加字段设置节点
为数据流添加一个字段设置节点用于排名计算:
2.4 设置排名
点击计算字段的「排名」,可以添加一个排名字段,排名字段支持以下设置:
- 字段名称:排名字段的显示名称;
- 排名规则:需要排名的字段数据,以及数据的排名方式;
- 分组字段:根据分组,在组内进行排名。如,根据年级进行成绩排名时,各个年级的排名分开进行,分别从 1~N 来排名。
注:
1)排名字段和分组字段均可添加 10 个字段。
2)排名字段支持数字和日期时间这两种字段类型。
3)排名方式支持升序、降序。
2.5 排名字段编辑
添加好的排名字段还可以进一步编辑修改以及删除:
2.6 效果演示
2.6.1 无分组
无分组的情况下,全量数据从 1 开始排名。比如,年级里的所有学生成绩通过一张表展示成绩,所有班级的学生按照成绩高低排名。排名效果如下图所示:
2.6.2 有分组
有分组的情况下,会在各自的分组内从 1 开始排名。比如,年级里的所有学生成绩通过一张表展示成绩,同一个班级的学生按照成绩高低排名,班级即为分组字段。排名效果如下图所示:
3. 注意事项
1)添加的排名字段输出的数据结果为数值类型,支持被计算字段二次计算。
2)同一分组下,数据相同的,排名相同。