数据分析师必须牢记的8个可视化技巧

“为什么我辛苦做的数据可视化图,老板/客户会觉得没有用,甚至会拒绝看?”

相信做过相关工作的人都能理解这种痛。

我也不例外,虽然个人而言很喜欢数据可视化,但实际上它并没有看起来那么容易制作。

就拿视觉元素来说,需要保持适当的平衡,不能做的太多或太少,所有正确的元素都必须以正确的比例出现。

这只是其中一角,还有查看对象、选择什么样的图、颜色等等都隐藏着或大或小的坑。

为此,我总结出了8个技巧分享给大家,希望能有所帮助。

1.数据可视化应针对特定受众,并有明确的要求

在创建数据可视化时,重要的是要了解图表的需求及其用途。仅这两件事就可以使你的可视化从单纯的图形变为有价值的信息。

  • 了解可视化的要求。了解可视化需要什么,并通过突出显示特定点来使其保持简单,避免信息过载。
  • 了解你的听众。在进行可视化之前,最好先问问查看对象将在图表中寻找什么。了解他们的要求和偏好、背景。此外,他们有足够的时间查看详细的可视化吗?如何了解可视化的上下文?还需要哪些其他信息?知道所使用的图形吗?……了解此类信息后,你可以将此作为创建可视化图的指南。

下面展示的图表就是个反面教材:

它犯了信息过载的错误,查看者很难理解它的目的,自然也很难接收到有效的信息。

这个图虽然看上去相对上一个视觉上好点了,但堆积的条形图对于初阶者来说很难理解,需要耐心的去解释。

如果查看者本身并不了解堆叠条形图,或者他只想快速浏览可视化内容。很显然,这个图并不适合。

2.为数据选择正确的可视化图表

这个技巧很重要。可视化图形有很多,哪个才能有效突显数据的关键信息?每个图都有特定的用途,你应该知道如何去选择它们。

  • 条形图是最受欢迎的数据可视化类型之一。可以快速浏览大量信息。一般用来比较同一类别中的一些值。例如,比较多年来两种不同产品的销售额。
  • 折线图则可以用来可视化连续时间间隔内的数值趋势。经常看到的示例是显示过去几个月公司月收入的趋势。
  • 散点图对于显示两个变量之间的关系很有用。可以轻松发现数据中变量或离群值之间的任何相关性。例如,用来比较房屋价格随客厅大小的变化。
  • 饼图适合于显示同一类别中项目的比例分布。但是谨慎使用,否则弊大于利。例如,一个国家/地区中android用户占iOS用户的百分比。
  • 直方图非常适合显示数据分布。例如,可视化多年来产品的订单数量。

……

还有很多,上述的就是一些比较常见的图形。不要害怕在可视化中组合多种图形,有时候它可以让查看者更详细的浏览数据。

下面这张图可以帮助了解何时使用特定的可视化图。

3.保持可视化效果简单

在做可视化图的时候,总想把很多信息都放进去,但都是必要的吗?

一张简单有效的图必须去除掉那些不必要的信息。

图中对帮助查看者理解图信息没什么作用的视觉元素,都是“图表垃圾”。比如不必要的网格线、分散注意力的图案、多余的轴、阴影等。

下面这个图就是一个例子。

其中的网格线,加粗但难以辨认的文本和3D图形都是“图表垃圾”。实际上,一个简单的二维条形图就足够了。

再举一个例子,这个图中的Logo就显得有点多余,不太能让人理解所传达的信息。

4.为数据可视化图打上标签

这种技巧也很重要,可以帮助更好地传达视觉效果。

但在创建的时候很容易忽略它,所以记得在开始数据可视化之前对标签进行下检查。

  • 标签应该清楚。如果不清楚,它就没有用。
  • 为图表命名。给图形赋予合适的标题,这样方便查看者立即了解图形主题。
  • 明智地使用图例。图例可以使得更容易发现图中各条线之间的差异。但是,使用折线图时,请尝试标注直线,这样可以更轻松地识别线。
  • 标记轴。有时从标题中可能不清楚轴代表什么。因此,可能会需要标记轴。
  • 注意轴上的标签。有时,并不需要标记轴上的所有刻度。可以间隔适当的范围去进行标记。

下面的图很好的说明了标签的作用。图上方的标题传递了可视化图的主题,并且使用刻度的适当范围对轴进行了标记。这样就可以确保将消息清楚地传递给查看者。

在下面的数据可视化示例中,使用图例代替直接标记线。尽管技巧上是正确的,但是使用图例间接的对线进行标记,对于比较线与线的区别而言,很难分辨。

5.了解图表中文本的重要性

数据可视化不仅仅是数字。文本提供了重要的上下文,可以向查看者传达正确的信息。比如放在图表旁边的标题,子标题和注释会解释图表想要显示的内容。

但是如果放置了过多且重复的文本信息,反而会适得其反,最终弊大于利。因此,最好适度使用文本。

  • 尽可能尝试使用简单的短语。目的是使可视化能够说明一切。
  • 仅保留那些提供相关信息的注释。为每个数据点放置注释,会分散查看者的注意力,造成一定的视觉混乱。
  • 可能需要使用粗体或斜体文本来突显重要的部分,但请尽量不要过度使用它们,否则常规文本和强调文本之间没有区别。
  • 避免文本重复同一条消息。例如,重复相同信息的标题和子标题。
  • 避免使用难以阅读的分散字体。这样能够确保查看者能立即掌握图形传递的消息,而不需要花费额外的精力。

在下面的数据可视化示例中,子标题文本似乎是不必要的。y轴上的生活满意度量表也不需加以说明。另外,在x轴上使用“人均实际GDP(PPP)”就可以,无需在副标题中提供解释。

6.在数据可视化中有效使用颜色

合理利用色彩会吸引查看者的注意力。但使用不当则会产生误导。

  • 对相同类型的数据使用相同的颜色。例如,代表一年中汽车销售的条形图可以用一种颜色表示,而自行车的销售则是另一种颜色。
  • 文本注释的颜色应与它所代表的条或线相同。这可以让查看者能够轻松识别文本所代表的数据。
  • 可以使用相同颜色的阴影来描述数据强度的下降。
  • 限制使用不同的颜色。使用过多的颜色会造成混乱的可视化效果。
  • 使用查看者熟知的颜色代表。例如,即使没有提供说明,观看者也可以容易地理解红色代表高温,而蓝色则是代表低温。

下面的图表就是一个使用颜色进行可视化的经典案例。

7.避免可视化产生欺骗效果

在我们努力创建令人惊叹的可视化效果时,很容易不小心让查看者产生“误解”。例如挑选数据,忽略基线,信息过载等,都可能导致一些假象。

这是挑出来的一些注意点:

  • 在图表中包括基线。避免基线是欺骗的最基本形式。这会人为地扩大两个数据组之间的差异。
  • 在图表中不包括完整的数据可能会给查看者提供不完整的图片,从而导致错误的决策。例如,仅可视化表示销售趋势的一小部分销售数据,而从整体上看,实际上存在下降趋势!
  • 隐藏重要数据。这会让查看者将注意力从最重要的部分转移走。
  • 欺骗查看者的一种非常聪明的方法就是在图表中放入过多的信息。这会给查看者造成一定的困惑,无法专注于某个特定趋势。
  • 违反惯例。例如,使用绿色表示错误,使用红色表示正确。

股市的可视化图就是个经典示例。

左侧的可视化效果显示了该公司过去一个月的表现,看起来公司经营状况不佳。但是,如果我们查看过去6个月的股价,实际上是在上涨,并且表现相对不错。

下面的数据可视化示例则造成了另一种假象。查看者会将注意力集中在描述Facebook使用情况的直线上。但是,如果仔细看,就会发现Instagram的使用量不断增加,而Facebook却停滞不前。

 8.数据可视化具有可解释性

数据可视化图的可解释性比其视觉吸引力更重要。到目前为止,所说的技巧涵盖的所有要点都是为了让可视化更具可解释性。

而视觉,图案,颜色等这些,只有在没有让图中消息失真的情况下才是好的。

下图就是一个示例。创作者试图在印度地图上代表不同印度语言的用法。不仅使用任意形状来表示数字,而且语言的位置相对于所属的区域也是错的。例如,北部拥有Telegu,南部拥有Gujrati。

表示此类数据的更好方法是仅使用条形图,这样会突出显示不同语言的排名。

因此,每当涉及到数据可视化时,始终要优先考虑可解释性而不是美观。

结尾

上述的数据可视化技巧虽然并不详尽,但对大家制作正确的数据可视化图表有一定帮助,可以当做一个简化版的指南。

如果你有其他一些可视化技巧,欢迎留言交流~

原文来源:

https://www.analyticsvidhya.com/blog/2020/07/8-data-visualization-tips-to-improve-data-stories/,有所修改以及删减

发表评论

邮箱地址不会被公开。 必填项已用*标注