合适的数据可视化?

数据挖掘 可视化 ggplot2
2022-02-23 00:46:05

我想在我的论文中加入一个情节,以突出自行车碰撞结果的区域差异。现在我可以使用几种绘图可视化,但我不确定哪一种最合适。拥有一个“无标度”的 y 轴可以更好地突出每个区域之间的差异,但它也可能使读者感到困惑。

我知道对此可能没有最佳解决方案,但我很高兴听到您的想法。(如果您对适当的情节有完全不同的建议,而不是下面的建议,我也很乐意听到这些建议)。

这些是我制作的情节:

地块 1 地块 2地块 3地块 4情节 1 情节2 情节 3 情节 4

3个回答

调查这么多情节可能会错过更大的图景。
我们应该将初始图保留在“一个合并图”中,例如

在此处输入图像描述


可以添加一些其他合并视图 - 区域和车辆聚合数据的饼图

  • 每当你给出百分比时,你需要一个关于分母的非常清晰的陈述。我可以在这里推断出来,但总的来说,可以给出中等城市所有事故中仅自行车事故的百分比,或中等城市发生的所有单车事故中仅自行车事故的百分比。或者...

  • 百分比(或绝对数字)的种类需要适合您的分析目的 - 如果不了解有关您的分析的更多详细信息,我们无法说出这一点。
    如果没有详细信息,我会报告绝对数字(或每次骑行距离或每次骑行的事故)。

  • 我会为所有方面选择相同的 y 轴。

  • 我会尝试散点图而不是条形图。在这里,这将是平行坐标图。平行坐标图的极坐标变体是星图。

  • 无论绘图类型如何(平行坐标、星形、条形),您都有两个分组变量(区域类型和事故类型)。尝试两种方式:区域作为 x/角度轴,事故作为颜色/面,事故类型作为 x/角度,区域类型颜色/面。我通常会选择一个图表作为正文,然后将另一个图表放入补充材料或附录中。

  • 如果您选择在文本中添加百分比图表,请考虑将绝对数字图表也放入补充材料或附录中。

在我看来,鉴于您的信息的复杂性,最能实现您的目标而不会误导的情节是情节 4。

即使您的 Y 轴发生变化,所有信息对读者来说都非常清楚。

我认为这里的重要选择是,如果你想以最清晰的方式向他们展示,或者你想用其他情节引导他们得出其他结论。