如何看穿数据可视化的谎言

以前我们看到一个做得很烂的图表,或者穿帮的数据可视化作品时,往往是将它们嘲笑一番也就算了。但有些时候,尤其是刚过去的这一年,我们好像更难分辨一个可视化作品是单纯的糟糕产物,还是出于偏见而刻意制造的虚假信息。

当然,用数据来撒谎已经不是什么新鲜事儿了,但现在图表越来越容易被广泛传播,网上到处都是,而其中好多传递的是假象。你可能只是随便瞟了一眼,但一个简单的信息也可能在脑子里生根发芽。在你还不知道的时候,小李子已经在桌子上转起了陀螺,而没人关心它会停下来还是会一直转下去。

自然而然地,现在我们需要快速看穿一个图表是否在撒谎,而这篇图文就是你贴心的指导手册哟。

1)截断数轴

左边的y轴数据从10开始,纯粹的瞎话。右边的数据从0开始,很好。长度是柱状图视觉呈现的关键,所以当某些人通过截断数轴而故意把长度缩短时,整个图表的差别就变得更明显了。这些人想要展现出比实际情况更剧烈的变化。我在另一篇文章里详细谈了这个问题。

2)双重数轴

 

它用了两种差距极大的比例,可能是为了强行扯上因果关系。通过使用双重数轴,数据的量级可以根据两种度量来缩小或扩张。人们通常用它来表达相关度和因果关系。“因为这个东东,另一个事儿发生了,看,很清楚吧。”

Tyler Vigen做的假相关数据的项目是个极好的例子。

3)总和不对头

饼图中所有部分的比例加起来超过了100%。一些图表专门要展示总体中的某些部分,而当这些部分加起来超过了总和,问题就很大了。比如,饼图代表的是总共100%,而如果每个扇形的比例加起来超过了100%?怪怪的噢。

可以看看这个搞笑的例子。

4)只看绝对值

这其实只是人口分布图。当你对比不同地方、种类或群体时,你必须考虑相对值,公平比较任何事物都是相对的。你不能因为某个城镇发生了两起抢劫案,另一个只发生了一起,就说第一个镇更危险。万一第一个镇的人口是第二个的一千倍呢?更有效的方式往往是对比百分数和比例,而非绝对值和总值。

这幅xkcd的漫画很直白地展现了人口绝对数的影响。

5)有限范围

左图看上去增幅很大,但右图显示出这只是常态,且选定时间内的增幅实际并不明显。人们倾向于精心挑选日期和时间段来配合特定的叙事,所以更应该考虑到历史背景、时常发生的事件,以及合理的用来比较的基准。

当你研究全局时,可能会发现有趣的事情。

6)奇怪的分级

左图只有两个分级,大于1的究竟包括些什么?可能在打掩护。右图更好,展示了更多变量有些可视化作品会过分简化一个复杂的模型,而非展示出原数据中完整的变量范围。这样做很容易会把一个连续的变量转化为从属于某一类别的变量。

广泛的分级在某些情况下很有用,但复杂性往往才是事物的意义所在。要防止过分简化。

7)混乱的面积比

30是10的三倍,但或许是为了增加显著性,图上最大的矩形比最小的大得可不止三倍。如果按照面积来进行视觉上的编码,图形的大小比例就该是面积的比例。有些人却在做面积编码的可视化时,改变边长的比例来突出大小对比,完全是为了抓马啊。

有时这种错误是无意间造成的,更需要警觉。

8)操控面积维度

 

上下两个图形的面积相等,但看上去很不一样。或许有人懂得怎么用面积来做视觉编码,却还(gu)是(yi)做出了上图这样的东西。我还没见过如此夸张的例子,但以后说不定就会有。我打赌连象形图都能出现,等着瞧吧。

9)为了三维而三维

千万别。当你看到一个明明没必要还强行用三维的图表,请质疑它的数据、图表、作者及图表衍生出的任何事物。

划重点:如果一个可视化作品出现了以上任何问题,并不代表它一定在撒谎。正如Darrell Huff在《如何用数据撒谎》里说的:

“本书的标题和里面一些内容可能像是在说,所有类似的作品都是为欺骗而生的产物。美国统计协会一个分会的主席曾经因为这个批评我,他觉得与其说出于欺骗,倒更像是能力不足。”

当然,这并不等于就可以原谅,毕竟也做错了嘛。但记住这点,你在骂某某某是骗子之前就可以再考虑考虑。

我的经验是,仔细检查那些令人震惊的、比想象中更具戏剧性的图表。

图表并不能让虚假的信息变成真的,数据也不能。它们会屈从于做图的人,也展示出信息本身之外更多的东西。那么,睁大你的眼睛咯。

本文作者:新浪新媒体实验室

来源:51CTO

时间: 2024-10-31 09:33:38

如何看穿数据可视化的谎言的相关文章

四个方法帮你搞定数据可视化界面设计

  "仪表板"."大数据"."数据可视化"."数据分析"--越来越多人和企业,开始运用他们的数据来做一些有趣的事情.在我的职业生涯中,有幸参与一大批数据为重的界面设计,我要在此分享一些观点,讲讲如何造就这种特殊且有意义的产品. 很多人已经讨论过这个议题,我会围绕创作过程中最具影响力的部分. 一.用户不同,数据不同 任何时候设计一套复杂的系统,都不可避免要为很多用户和角色进行设计.总裁.经理和分析师是几个常见角色,每个都有自己的

百度统计3.0蜕变:化繁为简呈现重点数据可视化

文章描述:倚天出鞘,屠龙开锋 – 百度统计3.0设计简记. 随着百度统计功能日趋完善,功能点逐步丰富, 3.0版是其易用性及交互视觉新的蜕变.此次升级以简洁一致的视觉风格.众多可视化元素.以及易用性改善,呈现出焕然一新的专业形象.接下来,就用以下几点简略讲述统计3.0的蜕变历程. 信噪比原则:化繁为简,呈现重点 好设计的目的是使信号最大化,而噪音最小化,从而产生一个高的信噪比.依据重要程度,控制整体信息对比及优先级,是本次升级的重要述求之一. 趋势图:将XY轴以外的线条.文字视觉弱化,以让趋势曲

数据可视化设计:给数据穿上美丽的外衣

文章描述:如今,在设计,通讯,信息及数据新闻,用户界面多个领域都可以见到数据可视化的身影,引入视觉设计的数据大大提升了说服力,可读性和逻辑性都得到了增强,他带来的不仅仅是颠覆表格那么简单,而是一种思想理念,它不仅把可视化信息作为一种沟通工具:同时也是一种重要的 如今,在设计,通讯,信息及数据新闻,用户界面多个领域都可以见到数据可视化的身影,引入视觉设计的数据大大提升了说服力,可读性和逻辑性都得到了增强,他带来的不仅仅是颠覆表格那么简单,而是一种思想理念,它不仅把可视化信息作为一种沟通工具:同时也

数据可视化(二) 使用 D3 组件进行布局

了解用于绘制各种排列的组件的图形计算 这个由两部分组成的系列文章的 第 1 部分概述了 SVG 和 D3 的结合使用,提供了创建社交媒体的浏览数据可视化表示的一些基本示例.第 2 部分将介绍在 SVG 图形中使用不同图形组件排列或布局的步骤.您将学习如何使用 D3 强大的图形计算在 SVG 画布上放置组件,以及如何将自己的图形操作与 D3 的布局相结合.我还将探讨如何使用 JavaScript 对象表示法 (JSON) 作为一种可用于可视化的数据格式.本文最后将展示如何使用布局组合在单个 SVG

数据可视化,第 1 部分: 使用 SVG 和 D3 可视化浏览指标

这个由两部分组成的文章系列将演示有助于从数据中提取有业务价值的信息的可视化技术 ,本文是这个系列的第一部分.您将看到如何使用可缩放矢量图形 (SVG) 和开源 D3         JavaScript 库创建可通过浏览器查看的可视化表示,通过形状和颜 色来传达信息.我将通过一些可视化浏览指标(与社交媒体使用相关)的示例来演示这些技 术.第 1 部分概述 了 SVG 和        D3 如何协同工作,还提供了 一些基本示例.第 2 部分        将会更深入地剖析这个强大的开放 标准技术

数据可视化设计在PPT中的运用

  图表数据的展示,是PPT设计中最常用的功能.要想让听众能快速理解PPT数据的内容,需要我们对PPT图表的数据进行可视化的设计处理.今天为大家带来Visage的数据可视化设计指南,我们可以了解到数据可视化设计的价值和数据可视化设计的科学根据,并且了解数据可视化设计的内容. 商务数据可视化设计指南  仅用文字不足以传达信息 作为人类,我们在生理上便倾向于阅读图形信息,我们能够更快速的理解图像--很久很久之前,人类便能理解图像的含义,而创造语言是为了更好地描述图像.这是我们的天性,因此视觉图形是信

如何让金融数据可视化

在互联网金融和金融互联网化的时代,日常生活被海量的数据化信息围绕.从设计层面来说,也是一项新领域的挑战.数据可视化设计是否有规律可循,从设计作品中能否发现其设计的共性和特点,如何从层层数据信息中提取重要的信息内容,通过简介易懂的设计语言准确表达.用设计师的眼睛,看见产品的连贯性.通过设计的信息会更合理,更能讲故事,让我们只关注信息的重点.否则视觉只是中看不中用. 数据可视化是什么 The main goal of data visualization is its ability to visu

Python的Tornado框架实现数据可视化的教程

  这篇文章主要介绍了举例讲解Python的Tornado框架实现数据可视化的教程,Tornado是一个异步的高人气开发框架,需要的朋友可以参考下 所用拓展模块 xlrd: Python语言中,读取Excel的扩展工具.可以实现指定表单.指定单元格的读取. 使用前须安装. 下载地址:https://pypi.python.org/pypi/xlrd 解压后cd到解压目录,执行 python setup.py install 即可 datetime: Python内置用于操作日期时间的模块 拟实现

想做热门信息图?得先搞懂数据可视化的五虎将

  因为接下来要做卖家后台数据纵横的改版,对数据可视化这块儿又进行了研究和心得的整理,跟大家分享下数据可视化常用的五种方式,希望能给大家带来思路的拓展. 概念 借助于图形化的手段,清晰.快捷有效的传达与沟通信息.从用户的角度,数据可视化可以让用户快速抓住要点信息,让关键的数据点从人类的眼睛快速通往心灵深处. 数据可视化一般会具备以下几个特点:准确性.创新性 和 简洁性. 常用五种可视化方法 下面从最常用和实用的维度总结了如下5种数据可视化方法,让我们来一一看一下: 一.面积&尺寸可视化 对同一类