Tableau 剧本 - 树形图
介绍
Tableau 是最受欢迎的交互式数据可视化工具。它提供了各种各样的图表,可让您轻松有效地探索数据。本系列指南 — Tableau Playbook — 将介绍 Tableau 中的常见图表。本指南将重点介绍树形图。
在本指南中,我们将按照以下步骤了解树形图:
我们将从一个示例图表开始,介绍它的概念和特征。
通过分析现实生活中的数据集,我们将逐步学习如何构建树状图。同时,我们将从 Tableau 可视化中得出一些结论:
- 根据基本流程构建图表。
- 使用高级功能优化和完善图表。
入门
例子
这是Data Revelations的树状图示例。该树状图比较了 2012 年大选各政党的选举人票数。可以很直观地看出哪个政党拥有超过 50% 的选举人票。我们还可以清楚地看到哪些州对选票的贡献最大。
概念与特征
根据维基百科对树形图的定义:
树形图将层次结构(树状结构)数据显示为一组嵌套的矩形。树的每个分支都有一个矩形,然后用代表子分支的较小矩形平铺该矩形。
树形图是Ben Shneiderman在 20 世纪 90 年代初发明的。Shneiderman 博士创建树形图是为了可视化分层数据。他想要“紧凑地可视化目录树结构”,但其他更常见的可视化方法对此效果不佳。
树形图原本是用来展示层次结构数据的,现在也用来展示部分与整体的关系。从大小和颜色可以清楚地看到哪些成分贡献更大。
与其他方案相比,树形图具有以下优点:
显示分层数据:这是它被创建的目的。为了显示分层数据,通常最好的可视化是两层。
可扩展性——支持大量类别:如果您需要比较数十或数百个元素并突出显示贡献成员,则可以考虑使用树形图。
空间利用率更高:密集的矩形几乎覆盖整个区域。
重点突出主要贡献者:树状图使用较大尺寸的矩形或显眼的颜色显示主要贡献者。如果您的应用程序有此要求,树状图是合适的解决方案。
但与此同时,反对的声音也不少。比如在 Andy Kriebel 的博客文章中,他不建议使用填充气泡图和树形图。他认为这会让观众很难做出精确的比较。
这里我也总结一下treemap的缺点:
难以进行准确的比较:人们更擅长比较长度或位置,但不太擅长比较矩形的面积。另一个问题是,在大多数情况下,您想要比较的组件没有共同的基线。条形图、点图和折线图提供了一种更定量和准确的比较方法。
小组件上没有标签:虽然树形图可以显示许多类别,但如果包含太多组件,矩形可能会变得非常小。Tableau 无法显示所有标签。这意味着您必须依赖 Tableau 的交互功能,例如工具提示或突出显示。
如果您需要进一步阅读,这里有一篇关于树形图的好文章。
数据集
在本指南中,我们将使用两个数据集:
第一个数据集是英国各行业的就业变化。感谢EMSI(经济建模专家公司)和Tableau提供此数据集。
该数据集包含 2011 年和 2014 年英国城市按行业和子行业划分的就业数据。
在本指南中,我们将分析各个行业的就业分布和变化。
第二个数据集是来自 Wikipedia 的移动操作系统的“全球智能手机销量” 。感谢Wikipedia和Gartner提供的该数据集。
该数据集包含 2007 年至 2017 年主流移动操作系统的智能手机季度销量。我做了一些数据整理工作。您可以从 Github下载我的版本。
在本指南中,我们将比较不同年份的Android、iOS、Windows、BlackBerry、Symbian和其他操作系统的市场份额。
基本流程
我们先从基本的树形图开始。在此示例中,我们将使用第一个数据集的第一张表,其中仅包含第一级行业。
作为标准图表,我们可以点击“Show Me”并查看树形图的请求。
对于树形图,尝试 1 个或多个维度、1 个或 2 个度量。
正如我们在“Show Me”选项卡中看到的,要构建树形图,我们至少需要一个维度和一两个度量。因此,我们按住 Control 键(在Mac 上为Command键)同时选择“SIC 代码”、“% 变化”和“2014 年就业”,然后在“Show Me”中选择“树形图” 。Tableau 将自动生成原始树形图。
但是我们最好手动构建它,因为 Tableau 放错了这两个度量。
- 选择正方形作为标记类型。
- 将“% 变化”拖入标记-颜色。
- 将“Jobs 2014”拖到标记-大小中。
- 将“SIC 代码”拖入标记-标签。
转换成发散和阶梯状的颜色,以更清楚地区分正值和负值:
- 单击标记中的颜色卡或单击图例中的倒三角形,然后选择编辑颜色...
- 我们要区分增长和衰退,所以我们选择发散的颜色:在调色板中选择橙色-蓝色发散。
- 我们发现一些正值和负值都是灰色的,因为它们位于这个发散色谱的中间。阶梯式颜色可以解决这个问题,因为它将值分组到统一的颜色箱中:选中阶梯式颜色并将步数设置为 8。
- 通过分析作业变化率的分布,为了更好的进行颜色区分,我们将颜色范围设置为-60%~100% :展开高级选项,将开始设置为-0.6,结束设置为1。
添加格式良好的标签:
- 将“行业”拖到标记-标签中。
- 展开标签卡并单击文本按钮。将文本编辑为<SIC 代码>: <行业>。
- 格式字体:选中粗体并将颜色更改为白色。
最后一步,让我们完善一下这个图表:
- 将标题编辑为“按行业划分的就业分布及变化”。
- 将“SUM(%变化)”数字格式化为百分比。
- 将颜色图例重命名为“%变化”。
基本的树形图已完成。
分析:
这个基础树状图同时显示了两个指标和一个维度。矩形的大小表示当前行业中分布了多少个职位,颜色表示该职位的变化。橙色越多表示减少越多;蓝色越多表示增长越多。
对于小矩形,您需要将鼠标悬停在上面才能在工具提示中看到详细信息。
高级功能
分层可视化
为了显示分层数据,我们使用第一个数据集的第二张表,其中包含两层行业。
和以前一样,我们手动创建一个基本的树形图。
- 选择正方形作为标记类型。
- 将“SIC-1 名称”拖入标记-<font style="v
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~