Tableau Playbook - 发散条形图第 3 部分
介绍
发散堆积条形图
例子
下面是使用Data Revelations中的发散堆积条形图的示例。
此图表显示了满意度李克特量表问题。值得一提的是,左右两栏中“中立”值所占比例相等。
从字面上理解,发散堆积条形图有三个特点:
- 作为条形图,它使用条形来比较值。
- 发散通常意味着中间有一条垂直基线。正值向右增长,负值向左增长。
- 堆叠添加了详细分布,例如非常不同意、不同意、中立、同意和非常同意(5 点李克特量表)。
具体来说,在 Tableau 中,我们已经知道发散条形图包含一个维度和一个度量。在此基础上,发散堆叠条形图添加了第二个维度或计算字段来堆叠条形。它突出显示了条形的双边,并进一步详细显示了部分与整体的关系。
最广泛的应用场景是展示调查中的回复频率,尤其是可视化情绪和倾向。
发散堆积条形图与百分比堆积条形图
发散堆积条形图和百分比堆积条形图的使用范围相似。因此,关于哪一个更好有很多争论。以下是Daniel Zvinca、Swexler以及Lisa C. Rost 和 Gregor Aisch的一些不同意见。
反对者认为发散图无法很好地处理共同部分,例如中立部分。他们强调中立部分很重要。他们认为将中立部分分开放置不是一个好主意。而且,如果我们确实将中立部分放在发散条形图的中间,则所有条形都没有共同的基线,这意味着我们无法直观地比较它们。但支持者解释说,更好的想法是将中立值放在条形的两端。换句话说,将更强大的观点放在中心进行比较。
反对者还提到 100% 堆积条形图可以更好地利用空间。这是真的,但在大多数情况下只是略有不同。
反对者认为,发散的图表使得条形图很难进行比较,除了中间的条形图。实际上,我相信这两个图表最多只有两个具有共同基线的部分(中间发散;边缘 100% 堆叠),而其他部分都变得难以比较。
反对者还表示,对于最外层的类别,100% 堆叠条形图让我们看到某个份额是总数的一半还是四分之一。但对于发散条形图,您需要在脑海中堆叠所有可用的条形图并进行一些估算才能确定。
相比之下,支持者反驳说,发散式条形解决方案通过不混合不属于同一组的价值观而显示出更多的清晰度。
他们还表示,采用发散式方法时,条形图会向左或向右移动,以显示候选人的倾向。移动条形图使图表更容易理解。
过程
我们已经提到了常见的场景是李克特量表。对于美国出生率数据集,我需要澄清一下,这个例子不是典型的用法,因为我们希望在这个系列中保持数据集和分析的统一。李克特量表的过程类似,如果您需要更多信息,请参阅此处。
构建此发散堆积条形图有两个关键点:
- 使用包含正值和负值的计算字段的现有度量或构造。
- 使用现有维度或在标记 - 颜色中构建另一个计算字段来堆叠条形图。
让我们一步一步绘制一个基本的发散堆积条形图:
- 在这个发散条中,我们想要显示与当前年龄组平均值的比率差异。因此,我们将创建一个计算字段“出生率差异比率”:
在数据窗格的空白处单击鼠标右键-> 选择“创建计算字段...” -> 输入公式([出生率] - {FIXED [开始年龄] : AVG([出生率])}) / {FIXED [开始年龄] : AVG([出生率])}
在这种情况下,共同基线将是零轴。我们在第 2 部分讨论了如何除以非零轴。
将“出生率差异率”拖到列架中并选择测量->平均值。
将“年龄开始”维度拖到行架中。编辑别名(如果您之前没有这样做过)。
现在我们有一个普通的发散条形图。然后我们将把它装饰成堆叠条形图。所以我们需要一个数据字段来堆叠。创建箱体以减少“年份”维度:
右键单击“年份”维度 -> 选择创建-箱... ->在弹出的对话框中将箱的大小编辑为 20 -> 将其拖入标记-颜色。
自定义条形颜色:单击图例中的倒三角形并选择编辑颜色...
- 选择您喜欢的调色板,例如“Jewel Bright”。
- 将特定颜色拖到相应的数据项。
为了获得更好的可视化效果,我们将视图从“标准”更改为“整个视图”。
编辑工具提示,特别是用于显示出生率绝对值的提示:
- 将“出生率”度量拖入标记 - 详细信息,并将工具提示更改为度量(平均值) 。
- 点击标记中的工具提示,编辑内容。
- 在最后一行,单击“插入”并选择“AVG(出生率)”。
在每个堆叠条形图上添加一个标签:
- 按住Control键(在 Mac 中为Command键)并将“AVG(Birth Rate Diff Rate)”拖到Marks - Label中。
- 右键单击此字段->单击默认中的数字->选择百分比->将小数位数编辑为 0。
最后一步,让我们完善一下这个图表:
- 右键单击“Year (bin) 3”并编辑别名...然后在值(别名)列中进行编辑。
- 将标题重命名为“按年龄和年份范围划分的出生率差异”。
- 隐藏水平轴并隐藏行的字段标签。
- 将图例重命名为“年份范围”。
分析
借助发散堆积条形图,我们可以比较按年龄范围和年份范围划分的生育率组的比例差异。与李克特量表的情况不同,这些条形的长度不等。
再看年龄段,1940-1959年,各个年龄段的生育率都很高,原因我们之前分析过,二战后美国主张生育,恢复发展。而2000年以后,25岁以下的生育率明显降低,原因可能是越来越多的年轻人选择推迟结婚生子。
探索年份范围,2000年至2013年,增幅最高的是35-39岁,可能是科技发展的支持(外因)和自我观念的转变(内因)共同作用的结果。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~