数据流基本认识

数据流,用于设置数据工厂聚合计算流程,每个数据流可以有 多个输入一个输出

名词解释

(1)输入与输出

  • 输入

选择输入源的数据流节点,即选择需要计算的表单。

  • 输出

将数据流最终值输出到数据仓库中的数据流节点,处理完毕的数据最终从该节点进行输出。

(2)横向连接

通过内连接、左连接以及右连接的方式输出为一个新的数据源。

位于连接符号左右方向上的表单分别为左侧表单和右侧表单


  • 内连接

根据连接字段,返回左右两侧表单连接字段相等的数据,即返回左右两个表单的数据交集。


  • 左连接

返回左侧表单的全部数据,根据连接字段,逐行匹配并连接右侧表单的数据,匹配不到则留空。


  • 右连接

返回右侧表单的全部数据,根据连接字段,逐行匹配并连接左侧表单的数据,匹配不到则留空。


(3)追加合并

将多个数据表中同字段类型字段合并为一列,合并后输出为一个新的数据源。

默认将同类型且同名的字段合并为一列,同类型不同名的字段可以通过拖拽的方式合并为一列,不同类型的字段不可合并。


(4)数据筛选

将数据源通过添加筛选条件,筛选出所需要的数据,输出为新的数据源流转到下一节点。


(5)分组汇总

对数据源里的表单进行分组及汇总计算。


  • 分组

可添加多个分组字段,至少一个;

支持的字段数据类型为文本、日期、地址(包括定位)、成员/部门单选。

在选择日期和地址(包括定位)字段时,会额外多出一行,可自行选择分组方式,

日期默认选择 年-月,地址默认选择 省-市


  • 汇总

文本、日期、地址类型,汇总方式只支持计数,计算该分组内该字段(非空)的记录总数。

数字类型,支持的汇总方式有求和平均最大值最小值计数,默认求和。


(6)字段设置

将上一步的输入端的表字段进行隐藏、重命名以及额外添加所需要的计算字段。


数据流基本规则

  • 数据流的设置方式采用输入 >> 计算 >> 输出的流程节点式设置。

  • 默认分别有一个输入和输出节点,输入端为起点,输出端为终点。

  • 输入没有节点入口、可以有多个节点出口,出口不能是输出 ,不可命名(取其所使用的表单名字)。

  • 输出只有一个节点入口、没有节点出口,可以命名,其结果集直接展示在数据仓库的数据页面。

  • 中间计算端可以命名,横向连接只能有2个入口,追加合并至少要有2个入口,其他计算只能有一个入口;可以有多个出口,但是最多只能有一个出口是输出。

  • 一个数据流里面只能有一个数据计算流程,不能存在多个孤立的流程、不能存在孤立的节点,并且至少要有一个输入和输出节点。


数据流基本设置

(1)数据流/数据节点命名

点击数据流名称和数据节点名称,可以进行重命名。

「输入节点」名称不可更改,使用数据源的表单名称


(2)修改/更新与删除

创建好的数据流可以进行二次修改;当数据源中的数据发生修改后,可以手动更新数据,也可以等一小时内其自动计算更新数据;不想要的数据流还可以进行删除。

设置方式:应用设置 >> 数据工厂 >> 数据流 >> 编辑/更新数据/删除


(3)更新日志

点击「更新日志」可以查看数据更新执行详情。

Peach是此帮助页面的作者。如果您对此页面的内容有任何意见,请在下方给她反馈。如需获取即时帮助,请联系技术支持。
本文是否对您有帮助?