Tableau Playbook - 双轴线图
介绍
Tableau 是当今最流行的交互式数据可视化工具。它提供了各种各样的图表,可让您轻松有效地探索数据。本系列指南 - Tableau Playbook - 将介绍 Tableau 中各种常见的图表。本系列指南将重点介绍双轴线图。
在本指南中,我们将从一个示例图表开始,介绍双轴的概念和特征。然后,我们将双轴技术应用于折线图。通过分析真实数据集:Rossmann Store Sales,我们将重点介绍如何逐步构建带折线的双轴图表。同时,我们将从 Tableau 可视化中得出一些结论。
入门
例子
这是Highcharts的一个双轴线图示例。该图使用带线的双轴来比较东京和伦敦的月平均气温。我们可以注意到两个 y 轴是同步的,这不会给读者带来混淆。此外,它使用带点的双轴来区分东京和伦敦。点强调了两个城市的个性。
借助双轴技术,我们可以分析每个城市的气温趋势。同时,我们可以比较两个城市在任意时间点的气温。
概念与特征
双轴技术是 Tableau 中最重要的技术之一。它为我们提供了一种将两个图表组合成一个共享轴的方法。此技术被广泛用于构建复杂图表。
具体来说,在 Tableau 中,它提供了对第二张标记卡的访问,从而可以在单个视图中组合多种标记类型。借助双轴技术,我们可以发挥想象力,构建Show Me模板之外的更多图表类型。
非同步双轴的误用
我完全同意Datawrapper这个博客的观点:
我们认为,具有两个不同 y 轴的图表使得大多数人难以直观地对两个数据系列做出正确的陈述。
如果这给我们的用户带来了麻烦,我们深感抱歉,但我们同意许多图表专家反对双轴图表的观点。
必须明确的是,本文中的“双轴图”特指非同步双轴图,同步双轴图则不存在这个问题。
我们最好避免使用非同步的双轴图,因为:
双轴图的比例是任意的,因此可能会(故意)误导读者了解两个数据系列之间的关系。
让我们通过以下示例来理解这种误导。我们可以通过截断或缩放 y 轴来显示红线和蓝线的各种关系。
以下是替代非同步双轴图的四种推荐替代方案:
- 并排图表会创建两个包含两个数据系列的不同图表,并将它们并排放置。缺点是两个图表可能比一个图表需要更多空间。
- 索引图显示的是我们数据系列的相对变化,而不是绝对数字。这是我们将在实践中使用的解决方法。
- 优先级和标签使双轴图仅显示一条线。不太重要的维度显示为注释。
- 连通散点图将一个变量保留在 y 轴上,将第二个变量放在 x 轴上。这是一张非常酷的图表。
数据集
在本指南中,我们使用来自本次 Kaggle 竞赛的Rossmann Store Sales 数据集。感谢Rossmann和Kaggle提供此数据集。
该数据集包含 Rossmann 856 家商店的三年销售数据。商店销售受多种因素影响,包括促销、竞争、学校和国家假期、季节性和地点。
我已经为该数据集完成了数据整理和特征工程。您可以从 Github 下载我的版本,以进行更好的探索性数据分析。
带线的双轴折线图
我们将从双线图开始分析销售额和客户之间的相关性:
对于只有一条线的折线图双轴,我们可以通过Show Me自动生成。这是构建双轴的第一个也是最简单的方法。单击Show Me并查看双线的请求。
对于双线,尝试 1 个日期、0 个或更多维度、2 个测量值。
按住Control键( Mac 上为Command键)并单击以多次选择“日期”、“客户”和“销售”,然后在“显示我”中选择“双线” 。
值得一提的是,Tableau 使用Measure Names将“Customers”和“Sales”打包起来进行着色。
在此示例中,我们将分析一个月内的趋势。因此,我们将“YEAR(Date)”从连续日期值更改为月份。如果您仍然对这些概念感到困惑,可以参考折线图中的日期部分与数据值。
度量默认聚合为SUM 。但SUM在这里并不合适,因为 Customers 和 Sales 的分布在时间上都不均衡。通过分析 Customers 和 Sales 的分布,我们还可以发现数据是有倾斜的。因此,MEDIAN比AVG更好。
由于我们关注的是客户和销售额的趋势和比较,我们可以截断轴以获得更好的视图。虽然不适当的轴截断可能会导致误导性图表,但在这种情况下,根据Quartz 的这篇文章,这是一种合适的用法。
右键单击左轴和右轴,然后取消选中“包括零以自动截断”。
完善此图表:
- 将标题编辑为“月度客户和销售趋势”。
- 右键单击 x 轴,然后单击“格式...”从“轴”选项卡中展开“刻度选项中的日期”,然后选择“自定义”。然后将格式自定义为mmm yyyy。
- 在编辑轴中删除日期轴标题“日期月份” ...
目前,此图表是非同步双线图,因为它有两个不同的 y 轴。我们已经讨论过此类图表的许多缺点。所以我们最好使用索引图表来代替它。
索引图表并没有告诉我们任何关于绝对数字的信息,而是显示了我们的数据系列随时间的相对变化,即变量随时间的增加或减少的百分比。
- 将度量从绝对值改为相对值。右键单击“MEDIAN(Customers)”和“MEDIAN(Sales)”,然后选择“快速表计算” ->“总额百分比”。
- 右键单击右侧轴并选中“同步轴”。
- 由于两个 y 轴是同步的,我们可以通过取消选中“显示标题”来隐藏右侧轴。
让我们再次完善新图表:
- 将标题编辑为“月度客户百分比和销售趋势”。
- 编辑别名,使其更容易理解。
- 将 y 轴标题重命名为“百分比”。
分析:
借助折线双轴,我们可以发现Customers和Sales的趋势线非常相似。 Customers和Sales之间存在很强的正相关性。
借助双轴技巧,折线图可以与多种标记类型组合,例如线、点、区域和条形图。通过将折线图与其他视觉元素结合,我们可以看到两者在不同场景下的实力:
- 当您需要比较不同数据系列的两个趋势时,请使用带线的双轴。强烈建议同步 y 轴。
- 如果您想在显示趋势的同时强调个体,您可以考虑使用带点的双轴来增强数据点。
- 当您需要特别注意两条线之间的差异时,请选择带面积的双轴。它会突出显示边距,以便于分析。
- 当你不仅关注整体趋势,还关注类别比较时,带条形的双轴是最佳做法。
<font style="ve
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~