简道云已经诞生5年了,大家在使用简道云时知道可以实现数据库存储数据功能、可以实现应用设计功能、可以实现报表展示等BI功能,但是在多维数据集上的分析处理能力,简道云之前一直是个问题。
但简道云母公司帆软软件毕竟是专业报表软件企业,深耕企业数据分析多年,简道云的数据分析处理能力自然也不会差。
要想做多维数据集的分析处理,那么多维分析模型的搭建是必要的。下面我们便尝试通过实例来浅谈一下关于简道云的数据分析模型设计。
在聊分析模型时先聊聊数据处理仓库及建模技术。
1.关于数据仓库
数据仓库(Data Warehouse,DW)是企业为处理分析收集到的所有数据而生的一种技术,需要解决的问题是如何处理数据、如何分析数据,区别于数据库技术的为业务操作而生。
数据仓库具有以下5大特点:
(1)面向主题
数据仓库通过一个个主题域将多个业务系统的数据加载到一起,为了各个主题(如:用户、订单、商品等)进行分析而建,操作型数据库是为了支撑各种业务而建立。
(2)集成性
数据仓库会将不同源数据库中的数据汇总到一起。
(3)历史性
较之操作型数据库,数据仓库的数据是为企业数据分析而建立,所以数据被加载后一般情况下将被长期保留,前者通常保存几个月,后者可能几年甚至几十年。
(4)时变性
是指数据仓库包含来自其时间范围不同时间段的数据快照,有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告。
(5)稳定性
数据仓库中的数据一般仅执行查询操作,很少会有删除和更新。但是需定期加载和刷新数据。
看完数据仓库的这些特点,是不是觉得简道云今年更新的数据工厂功能也是符合这些特点的呢!
2.关于数据仓库建模
数据仓库建模主要有三种模式:
星形模式
星形模式(Star Schema)是最常用的维度建模方式,下图是使用星形模式进行维度建模的图表关系结构:
可以看出,星形模式的维度建模由一个事实表和多个维表构成,且具有以下特点:
a. 维表只和事实表关联,维表之间没有关联;
b. 每个维表的主码为单列,且该主码放置在事实表中,作为两边连接的外码;
c. 以事实表为核心,维表围绕核心呈星形分布;
雪花模式
雪花模式(Snowflake Schema)是对星形模式的扩展,每个维表可继续向外连接多个子维表。下图是使用雪花模式进行维度建模的图表关系结构:
星形模式中的维表相对雪花模式来说要大,而且不满足规范化设计。雪花模型相当于将星形模式的大维表拆分成小维表,满足了规范化设计。然而这种模式在实际应用中很少见。
星座模式
星座模式(Fact Constellations Schema)也是星型模式的扩展:
前面介绍的两种维度建模方法都是多维表对应单事实表,但在很多时候维度空间内的事实表不止一个,而一个维表也可能被多个事实表用到。所以一般在实际业务分析时大多都是用星座模式来建模。
3.数据分析建模
本文将采用从网上找到的案例数据库,对简道云的建模稍作分析。
下面是通过power bi设计的分析模型
我们需要关注的主要指标为:订单量、销售额、产品销量及产品库存、毛利、顾客的赊账情况。
需要分析的维度有:
时间维度、产品维度、员工维度、顾客维度。
顾客和员工维度里又都有地域维度划分。
下面我们将依据power bi的关系模型,在简道云的数据工厂里构建这个模型。
可以看出整个模型里共分为4大部分(4个分组汇总)。
第一部分:解决顾客赊账额度及支付金额两个指标数据,及其所涉及的所有维度数据。
第二部分:解决订单量指标数据,及其涉及的所有维度数据。
第三部分:解决销售额、产品销量、产品的销售成本3个指标,及其所涉及的所有维度数据。
第四部分:解决产品库存指标,及其所涉及的所有维度数据。
最后通过追加合并将4部分维度及指标合并在一起,如下图所示:
每一部分的前端,都是通过横向连接,根据各表之间的表间关系(即各表的主键、外键关系),以左连、右连的方式连接在一起。
例如:
至此,我们的所有表的多维数据集的分析模型就已经搭建完毕。
下面便是通过这个模型数据,来搭建仪表盘BI,展示所有指标及各个维度的分析图表。
4.仪表盘BI图表展示
(1)整体数据展示
(2)订单量分析
(3)销售额分析
本文只做了这3部分的仪表盘设计,大家还可以根据实际需要自定义制作。至此,整个分析模型搭建及展示就结束了。
【特别感谢】:本文简道云用户马小龙先生原创分享,感谢马先生对简道云的大力支持!
【原文阅读】:「点击阅读作者原文」