Tableau Playbook - 条形图
介绍
Tableau 是当今最流行的交互式数据可视化工具。它提供了各种各样的图表,可让您轻松有效地探索数据。本系列指南 - Tableau Playbook - 将介绍 Tableau 中各种常见图表。本指南将重点介绍条形图。
在本指南中,我们将按照以下步骤学习条形图:
- 我们将从一个示例图表开始,介绍它的概念和特点。
- 作为本系列的第一篇指南,我将讲解学习前的一些先决条件,例如数据导入、预处理以及Tableau 中的相关重要概念。
- 通过分析一个真实的数据集:泰坦尼克号乘客的生存情况,我们将学习如何逐步构建条形图。同时,我们将从 Tableau 可视化中得出一些结论:
- 根据基本流程构建图表。
- 使用高级功能优化和完善图表。
- 作为基本的常见图表,我们将讨论它的变化。
入门
以下是Stackify的条形图示例。它显示了 2017 年 Github 程序语言的最多拉取请求。
从上面的例子中,我们可以看到条形图使用矩形条大小来直观地比较值。它允许相对和绝对比较。
条形图主要适用于类别比较,非常直观,但是不适用于大维度。
准备工作
数据集
在本指南中,我们使用泰坦尼克号数据集。感谢Kaggle和encyclopedia-titanica提供此数据集。
它包含了 887 条真实的泰坦尼克号乘客记录。有关更多详细信息,请参阅Kaggle。我们将分析哪些人可能幸存。换句话说,哪些因素影响乘客的生存?
我们将使用条形图及其扩展来分析该数据集。
数据导入
导入数据步骤如下:
- 从这里下载“titanic.csv”文件。
- 然后我们将数据导入 Tableau。您可以直接将此文件拖入 Tableau,或者在“连接”窗格中正式选择“文本文件”,然后导航到目标文件“titanic.csv”。
- 如果导入成功,您将在数据源选项卡中看到已加载的数据。Tableau 会自动推断每列的数据类型和作用,但并不总是正确的。所以,有时我们需要预处理。
在此之前,我们需要学习一些与 Tableau 相关的重要概念。
数据字段
将数据导入 Tableau 时,每列都将成为数据字段。数据字段具有两个重要属性:
- 数据类型:最常见的是数字(整数、浮点数)、字符串、布尔值和日期。
- 作用:将数据标记为维度或度量、离散或连续。它帮助 Tableau 以不同的方式可视化数据。
维度与度量
维度表示定性值,例如 ID、日期和类别。Tableau 不会使用它们进行计算,而是将它们显示为标题。
度量值表示您可以测量的定量值,例如销售额和温度。默认情况下,度量值在视图中聚合。
用另一种方式来理解它们,我在这里总结了一下:
Dimension 和 Measure 是数据的变量标记。这取决于您想要展示和探索的内容。当您想要聚合此数据字段时,请使用 Measure。
离散与连续
离散用蓝色表示,并在 Tableau 中显示标题。从字面上看,离散数据是单独的实体或单独不同的。
连续在 Tableau 中用绿色表示,并显示轴。相比之下,连续数据形成一个完整的整体,没有中断。
维度和度量都可以是离散的,也可以是连续的。
以下是所有组合的示例表:
数据字段角色 | 离散的 | 连续的 |
---|---|---|
方面 | 用户 ID(通用) | 日期(也可以是离散的、罕见的) |
措施 | 截断后的温度(非常罕见) | 销售(普通) |
如果您对这些概念感到困惑并且不清楚您的数据属于哪里,您可以切换角色并看看这会如何影响您的图表的外观。
数据预处理
在绘制图表之前,我们应该先准备好数据。一些预处理工作最好在 Tableau 之外进行,例如数据整理和特征工程。
这里我们来谈谈 Tableau 中的工作。主要是检查和更正我们之前提到过的数据类型和数据字段的作用。
让我们准备数据:
- 单击“工作表”选项卡。在左侧的数据窗格中,我们可以看到我们的数据字段已自动分配了类型和角色。
- 检查每个数据字段的类型。一切似乎都正确。
- 检查每个数据字段的作用。我们会发现“Survived”、“Pclass”、“Parents/Children Aboard”和“Siblings/Spouses Aboard”应该是离散维度。有两种方法可以实现这一点。
- 通过拖动到数据窗格进行转换。
- 右键单击并在弹出菜单中选择。
基本流程
让我们一步一步绘制一个基本的条形图:
单击“显示我”,您将看到条形图的请求。
对于水平条,尝试“0 个或更多维度”和“1 个或更多度量”。
选择“记录数”作为“度量”,选择“Pclass”作为“维度”。按住Control键( Mac 中为Command键)并单击以选择多个数据字段。然后单击“Show Me”中的水平条。将生成默认条形图。
根据上图的红色区域,我们可以将水平条换成垂直条,然后按升序或降序排序。
让我们完善一下这个条形图:
双击工作表标题并将其更改为“票种分布”。
双击轴并编辑。我们可以更改轴的范围、刻度和标题。这里我们将标题重命名为“乘客人数”。
右键点击“Pclass”,选择“编辑别名... ”,编辑“Upper”、“Middle”和“Lower”中的成员。
将“Pclass”维度重命名为“Ticket Class”。
现在,一个基本的条形图已经完成。请注意,Tableau 支持以多种方式完成此任务,因此有时我们仅介绍一种标准方式。
分析:
我们可以看到机票等级的大致分布。上层和中层乘客的数量接近,而下层乘客的数量几乎是其他舱位的两倍。
这就是我们目前所取得的成果。在下一节中,我们将了解票务类别如何影响生存。
高级功能
在本节中,我们将使用更多高级功能增强此条形图:
向此图表添加“幸存”维度:将“幸存”拖到“票种”之前的行架中。
将“幸存”标记为颜色:将“幸存”拖入标记 - 颜色。
显示每条柱状图上的乘客人数:将“记录数”拖入标记 - 标签。
隐藏“Survived”标题:右键单击“行架”中的“Survived”,然后在弹出的菜单中取消选中“显示标题”。
按照上述方法将“Survived”别名编辑为“Yes”或者“No”。
<font style="vertical-alig
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~