7种最常见的数据可视化错误

在数据可视化领域,正如同在其它领域一样,都有一定的规则、最佳实践、指导方针,然后就是常识。与我们的认识恰恰相反的是,常识是往往被忽略的,这一点我们会在下面的例子中看到。

就让我们从一些最常见的错误开始吧!

不要把数字加起来

当你画一个饼图、堆叠柱形图或是堆叠面积图时,所有数字的总和加起来应该是100。听上去似乎这种愚蠢的错误根本没必要指出,但你会因为人们多次犯这样的错误而感到惊讶。请看来自福克斯新闻的这一图片:

你能看出有什么问题吗?这三个扇形的数字加起来不是100%而是193%。在该调查中,很可能是允许一人投好几票的,因此饼图很明显不是能够体现这一数据的正确选择。

另外,如果你不读这些数字,只是观察饼图的大小,你会有这样一个印象:每位候选人得到的支持都将近三分之一。这又是一个错误的结论。

为了避免这样的错误,请仔细检查你的数字并且确保自己使用了标准的工具。这些工具不会让你做出像这样的错误的饼图。

不遵守惯例

就像饼图的各部分加起来应该是100,一个曲线图的曲线向右上移动表示数字的增长。因此,当你看到这个图表时你认为从2005年到2012年发生了什么?

一般的惯例会让你认为弗罗里达死于枪击的人数在2005到2012年间有所下降。但当你仔细观察时你会意识到Y轴是颠倒的。零值在顶部而最大值在底部,这违背了通常随着曲线的上升值变大的惯例。

你不需要什么特别的东西去避免这些错误。我们已经看了足够的图表,从而对什么是标准有一个大体的概念。只有这样做,你才不会出错。也许在某些情况下你需要违反约定,但这将是一个例外,而不是规则。
裁切不当的数据轴

坐标的值是为图表提供上下文并理解,弄错坐标直观上你会得出完全错误的图片。为了更好地理解我的观点,请观察以下图表。

福克斯新闻裁掉了Y轴。现在看来,七百多万的图形高度好像是六百万的三倍。这当然不是这样的情况。这里是被纠正过的图表。

这幅图是不是更好一些?这幅图以0作为基准线的y轴显示出的数据,表现出了准确的图像。

这里有相同错误的另外一个例子。

你只要不将y轴弄乱就可以避免这项错误。当必须要展示细节的时候,先用一个图表给出综合性的消息,然后再第二个图表中具体阐释第一个图表的某一方面。

不使用注解

算不上是错误,但无疑的是在你每次做图表时都会有一些小的缺失。有时候,在图中仅仅可视化是不够的,你需要在图表中加入一些描述性的文字或者数字使之变得更有意义。要理解我的观点,请观察如下图表。(使用谷歌图表制成)

这是一个非常好的图表,有着准确的标题和坐标轴,但是当你观察它的时候,你会不停的去想2015年发生了什么。是什么引发了销售数字的突然下降?

为了回答这个问题,你需要包括附有下降原因的正确注解:

现在这个比之前更好一些了吧?作为了一个读者,你不仅知道下降已发生了,还知道为什么发生了“下降”。

不正确的气泡尺寸

气泡图对于在二维空间显示三维数据是非常有用的。不仅有x轴和y轴,而且你可以通过改变气泡大小描绘第三种数量。

截至目前,我见过制作气泡图最普遍的问题就是他们改变气泡的半径而不是改变他们的区域来显示不同的数值。例如,请看这个图表。

我知道这里存在许多错误,但是为了理解刚才提到的这点,请观察最左边的气泡。他们代表的是9.2亿美元和18.4亿美元。但是这对吗?大气泡看上去是小气泡的四倍。如果你不读气泡内的文字,你肯定会产生误解。

如果你只是改变数据的区域而不是改变其半径比例的话,你就会很容易就避免这个错误。

不完整的数据

根据下面的地图你能得知这里的哪个公司拥有较多的市场份额吗?(利用图表生成器)

仅根据上面的地图,你一定会认为‘ABC’拥有更高的市场份额。但在这里正确的答案是——‘它是不完整的信息’。原因是:我们肯定知道ABC领先的州的数量比XYZ多,但是我们不知道这两种产品在每个州的销售额。

如果ABC是所有小市场的领先者,XYZ是所有大市场的领先者,将会怎样呢?这样在这个国家XYZ的销售额整体上将会很高,即使它领先的州的数量相对较少。所以想要知道谁拥有更大的市场份额,我们需要更多的数据。

难以比较

假设你是一位企业主,你的业务有全球影响力。你想要比较你的公司在不同国家的市场份额,用这个图表如何?

数据可视化就是要使解读数据更加简单而不是困难。但是,上述图表使得读者很难去比较。难道你不认为下面的图表有着更好的效果吗?

如果在做图表时你能从读者的角度思考的话,那么你可以避免一些这样或者其他类似的错误。或者在出版之前努力从你的同事或者朋友那里获得反馈,问他们该图表是否能轻易读懂?是否可以很容易地对比两个图表?如有需要也可以使用标签。上面的饼状图没有使用数据标签,但是堆叠柱状图有清晰的标签。
资源

数据可视化是一个广阔的领域,如果你在阅读这篇文章,那么意味着你想在这方面做得更好。所以,现在你已经知道了一些常见的错误,这里有一些可以帮助你提高的资源。

· 获得良好的基础:定期关注图表库的更新并了解每个表格的制作方法。“制图基础知识”和“动态数据”都是一些很好的资源。
· 使用正确的工具:使用正确的工具会使你的任务变得更加容易,因为它们的设计目的就是防止一些小错误发生。
· 避免错误:你可以犯你自己的错误,或者从别人的错误中学习。随时从Junk Charts 和 WTFViz学习保持并更新别人犯的错误。

本文作者:佚名

来源:51CTO

时间: 2024-09-21 16:07:32

7种最常见的数据可视化错误的相关文章

10种较为常见的服务器管理错误

错误|服务器 网络管理阶层的工作就是保证网络的正常工作,从而使得职工们的工作不被打断.可问题在于事物并非总是按照理想状况发展,事实上经常会出现平地起风波的状况.其间有许多原因,这里我们只讨论10种较为常见的网管错误. 1.UPS(不间断电源)的使用问题 某商店正在压榨它的网络系统的最后生命.尽管那台很老的服务器几乎难以满足商店运营的需要,但经营者甚至连更换UPS中的电池都不愿意,事实上电池每两年就应该更换一次.终于有一天突然停电了,而这个UPS实在是太老了,它已经不能控制服务器安全关机了.电池能

数据可视化是如何被创造出来的

我多次被炫目的数据可视化或信息可视化震惊,在我知道这些图片背后的数据来源和创造历程后,更是为之诧异不止.它涉足制图学.图形绘制设计.计算机视觉.数据采集.统计学.图解技术.数型结合以及动画.立体渲染.用户交互等.相关领域有影像学.视知觉.空间分析.科学建模等. 这是创造性设计美学和严谨的工程科学的卓越产物.用极美丽的形式呈现可能非常沉闷繁冗的数据,其表现和创作过程完全可以称之为艺术.所以我翻译了来自SM上的3篇数据可视化和信息图形的文章,主要是鉴赏并提供一些参考资料.我尽量查找了每张数据图表背后

数据可视化:常用图表使用总结

文章对常见的数据可视化图表进行了简单的汇总分析,希望对你有益. 什么是数据可视化? 数据可视化,简简单单就是把数据展示出来吗?非也非也,其终极是为了满足用户对数据的价值期望,利用数据,借助可视化工具,还原和探索数据隐藏价值,描述数据世界. (⊙o⊙)-还是说人话吧,就是以下两步. 分析需求,熟悉数据,制定目标. 选用合适图表(柱状图.折线图.散点图.饼图.雷达图.漏斗图)进行组合进行数据展示. 为什么要做数据可视化? 你难道不欣赏折线图那婀娜多姿的曲线?柱状图那美丽的大长腿? 美丽! 直观! 有

大数据可视化的最新动态

引言 数据可视化 是将数据以不同形式展现在不同系统中,其中包括属性和变量的单位信息.基于可视化发现数据的方法允许用户使用不同的数据源,来创建自定义分析.先进的分析集成了许多方法,为了支持交互式动画在台式电脑.笔记本电脑或平板电脑.智能手机等移动设备上创建图形桌面.根据调查,表1显示了数据可视化的好处. 对于可视化有以下几点建议 大数据 是大容量.高速度并且数据之间差异很大的数据集,因此需要新的处理方法来优化决策的流程.大数据的挑战在于数据采集.存储.分析.共享.搜索和可视化[5] 1."所有数据

数据可视化——“科学与艺术的结合”

数据可视化,是关于数据视觉表现形式,在大数据领域中,素来有"科学与艺术的结合"的说法.这种数据的视觉表现形式被定义为,一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量. 事实上,数据可视化是一个处于不断演变之中的概念,其边界在不断地扩大.这里的变化主要指的是技术上较为高级的技术方法,而这些技术方法允许利用图形.图像处理.计算机视觉以及用户界面,通过表达.建模以及对立体.表面.属性以及动画的显示,对数据加以可视化解释.与立体建模之类的特殊技术方法相比,数据可视化所涵盖的

大数据可视化的新进展

在简化数据量和降低大数据应用的复杂性中,大数据分析发挥着关键的作用.可视化是其中一个重要的途径,它能够帮助大数据获得完整的数据视图并挖掘数据的价值.大数据分析和可视化应该无缝连接,这样才能在大数据应用中发挥最大的功效.这篇文章将介绍一些常规的数据可视化方法以及在大数据应用领域突破常规的可视化手段,也会讨论大数据可视化带来的挑战,同时介绍大数据可视化领域新的方法.应用程序以及其技术的进步. 一.引言 数据可视化是将数据以不同形式展现在不同系统中,其中包括属性和变量的单位信息[1] .基于可视化发现

干货 | 数据可视化中5个常见错误及克服方法

数据可视化的普及和影响在相对较短的时间内急剧增加. Google趋势显示,自2009年以来,数据可视化的搜索频率几乎增长了100%,我们已经看到了大量可用的工具和软件,几乎任何人都可以相对轻松地创建数据可视化. 比起文本,我们本能地更热衷于图像,因为大脑能够以更快的速度处理图像. 然而,这并不意味着你可以把大量的图像和形状放在仪表板上,并期望你的观众赞叹. 就像在我们被图像吸引背后的认知方面,还有其他固有的东西,在某种程度上,与潜意识的行为变得相关. 其中之一就是第一印象. 我们都知道这句话:第

5个常见的展示不同类型数据的错误形式以及如何避免

5个常见的展示不同类型数据的错误形式以及如何避免 数据可视化的普及和影响在相对较短的时间内急剧增加. Google趋势显示,自2009年以来,数据可视化的搜索频率几乎增长了100%,我们已经看到了大量可用的工具和软件,几乎任何人都可以相对轻松地创建数据可视化. 比起文本,我们本能地更热衷于图像,因为大脑能够以更快的速度处理图像. 然而,这并不意味着你可以把大量的图像和形状放在仪表板上,并期望你的观众赞叹. 就像在我们被图像吸引背后的认知方面,还有其他固有的东西,在某种程度上,与潜意识的行为变得相

大数据可视化必须避免的三种常见错误

文章讲的是大数据可视化必须避免的三种常见错误,最近一段时间以来,围绕数据可视化所展开的讨论可谓层出不穷--其话题之丰富.交锋之激烈甚至不亚于大数据技术本身.目前业界普遍认为可视化是最优秀的(或者说是惟一一种)数据内容表达方式,甚至如果不对数据进行可视化处理,我们将错失大量宝贵信息. 可视化是获取并分享观点的绝佳途径,但很多大数据团队却没能选对正确的方式.可视化怎么会出现问题?原因很简单,因为存在多种可能破坏数据可视化效果的实施方式.下面我们就一同来探讨最为常见的三种错误实践. 错误一:显示所有数