选择图表
数据可视化第一步,首先要问:即将产生的这份数据可视化报告谁来用,什么场景下用、用来说明什么问题,选什么样的数据制作什么样的图表比较合适?
当我们确定了业务需求、确定了数据之后,就要开始考虑将数据转化为合适的图表了。
1. 为什么要使用图表
当我们确定了业务需求、确定了数据之后,就要开始考虑将数据转化为合适的图表了。
图表能帮我们对数据的无感转化为对图像的有感,例如下表:看一、二、三、四组数据的时候,普通人是看不出他们的差别的,但是转化为图表后,我们就可以发现这些数据的规律。
数字 | 转化为图表 |
从以上可以看出,我们通过图表让数据最直观的展现,从而帮助洞察数据背后的业务问题。
可见数据转化为图表是数据可视化环节非常重要的一环。
2. 图表设计的痛点
当你开始将数据转化为图表,开始制作图表的时候,不管你用何种工具,都会遇到一个问题,我该选用哪种图表形式?
折线图、柱状图、饼图、雷达图......
即使选对了图表,做出来的图表能不能令人满意呢,是不是能帮助我们洞察业务问题呢,不正确的设计是不是反而增加了用户的理解成本呢?这些都是选择图表所产生的问题。
那接下来我们先来解决如何选择和使用图表的问题?
3. 如何选择正确的图表
选择前,我们首先要想清楚,解决的问题是什么,我的数据是什么,需要用图表做什么?而不是图表长什么样子。
在《用图表说话:麦肯锡商务沟通完全工具箱》这一经典著作中,作者阐述了他经典的方法论,也就是以下3 步:
- 步骤 1:确定表达的信息
- 步骤 2:确定对比关系
- 步骤 3:选择图表形式
确定表达的信息其实也就是解决的问题是什么,我们的数据是什么,需要用图表做什么,这个在我们选用图表之前就应该心里有数。
当确定表达的信息后,接下来我们就要看可视化目的,可视化目的需要根据数据特征和业务需求来确定,如:
- 要从多个类中看出谁的份额多,那就是占比构成
- 要看多个部分谁的销量高,那就是排序比较
- 要看在商铺全国分布的情况如何,那就可以使用位置分布
当我们确定了可视化目的后,就可以选择合适的图表了,如下表:
定义 | 示例 | 图表形式 | |
对比关系主要用于分析一组数据或多组数据之间的数据变化情况 | 不同部门的销售额情况 最近7天每天销售额情况 | 柱形图、条形图、面积图等 | |
构成分析主要表达的是局部和整体之间的占比关系 | 5月份,A产品的销售量占公司总销售量的首位 | 饼图、旭日图、矩形树图等 | |
分布关系表达的是数据在一定空间维度下的数据分布情况 | 一个班级中,同学体重、身高的分布情况。 | 散点图、地图等 | |
数据联系可以动态反映相关路径之下对象之前的联系 | 网站中,浏览商品到最终购买商品的转化率 | 漏斗图 | |
直观的展示当前情况或用进度条展示目标完成度 | 本月的销售目标进度完成如何? | 指标卡、计量图 |
除了根据可视化选择图表,还可以根据分析数据的特征选择合适的图表,如下表:
数据特征 | 说明 | 图表形式 |
连续数据(变量特征) | 连续数据通常用于揭示一组数据的变化趋势,尤其是按照时间维度的统计分析。 | 折线图、曲线图、面积图等 |
离散数据(变量特征) | 离散型数据关注数据的整体变化特征和分类对比情况。 | 柱形图、饼图 |
多维度数据需要结合颜色来显示不同维度的变量,从而更好地呈现多维度的关系和模式 | 多系列柱形图、堆积柱形图等 | |
即需要展示数据层级结果或层级关系,又希望查看数据的构成关系。 | 矩形树图、旭日图 |