通过一个视频剖析数据可视化的秘密

文章讲的是通过一个视频剖析数据可视化的秘密,研究数据的方法有很多,比如利用统计方法,计算数据的平均值和标准差;再比如使用模型,拟合数据。数据通常是大量的,人脑难以直接把握其中的信息。研究数据的最终目的是减小海量数据的信息量,将数据中的信息客观的展示出来,并最终整理成简单的,人脑可以掌握的知识。

  数据可视化

  图形是直观呈现数据的直接方法。然而,将大量数据在同一个图表中画出来并不容易。早期的测绘、天气数据都需要长时间的手工绘制。随着计算机绘图功能的开发,手工绘画已经完全被自动绘图程序取代。问题的核心转移为,要以怎样的方式呈现数据,以便数据中的信息能自然的体现出来。数据可视化(data visualisation)就是研究如何利用图形,展现数据中隐含的信息,发掘数据中所包含的规律。它是一门横跨计算机、统计、心理学的综合学科,并随着数据挖掘和大数据的兴起而进一步繁荣。

  下面一个视频来自Hans Rosling。他是瑞典的一位医学家,同时也是统计学家。在下面的这个BBC制作的视频中,Hans Rosling用丰富的可视化手段,展示了近两百年来世界各国人口和收入的演化。我给这段视频增加了中英文字幕,以方便观看。如果有错误,请见谅。

http://v.youku.com/v_show/id_XNTA3NDk0MTk2.html

  数据的信息维度

  Hans Rosling所做的数据图值得研究。数据展示的基本信息有2个维度:

  1) x轴, 人均收入

  2) y轴, 人均寿命

  这两个轴是作者想要表达的最基本信息。图上的每个点代表一个国家,该点所在的x-y位置代表了国家的人均收入和人均寿命。人均寿命的刻度线性增长(25岁,50岁,75岁),但人均收入的刻度是指数增长(400元,4000元,40000元)。人均收入的刻度非常值得注意,否则很容易给人造成错误的印象。比如说三个国家A,B,C,人均收入分别为40, 4000, 40000元。尽管在图表中,A和B,B和C都只相差一个刻度,但C和B的收入差距实际上A和B收入差距的10倍!

  此外,还有两个维度的辅助信息:

  3) 圆圈大小,国家人口

  4) 圆圈颜色,国家所在区域

  平面可以自然的分为两个维度(比如上面的x和y)。为了增加其他维度的信息,我们需要考虑其他的独立表示方法。数据点可以有尺寸大小和颜色变化。正如这里所显示的,Han Rosling利用这两个图像特征来表示两个独立的维度(国家人口,国家所在区域)。

  通过整个视频中年份的变化,Han Rosling还有一个明显的5)时间维度。利用动画的形式来记录信息随时间的变化状况,是数据可视化中常用的手段。然而,在使用动画的时候需要谨慎。动画会留给观众相对比较少的时间进行深入思考。所以在动画过程中需要适当的暂停(或者截图)来显示一些典型状况。

  最后,整个数据还有一个非常隐藏的信息维度,就是Han Rosling不时的会表明某个圆圈所代表的6)国家名称。也就是说,国家名称也是一个隐含的,随时可以获知的信息。

  眼见为实?

  随着Han Rosling慷慨激昂的演讲,我们被带往一个结论:这个世界的收入和寿命差距在减小。世界作为一个整体,变得更加富有也更加健康。

  数据似乎是在说明这一点。或者不是?

  比如上面两个截图,被用来说明国家间的差距在减小。然而,我们上面提到,收入的刻度是10倍增长的(这样的刻度被称为对数刻度)。所以当一个国家比较富裕之后,它的财富增长比较难以在刻度上体现出来。比如同样增加3600元的收入,可以让一个原来收入400元的国家跨入中间区域,而一个原来收入40000的国家几乎原地不动。如果将x轴改为线性,那么国家间人均收入的差距将大大超越这幅图所带给人的直观感受。

  (而在不考虑通货膨胀的情况下,所谓的整体收入增长的结论也不是很可靠。)

  从y轴的信息看,整个世界的健康水平是提高了。即使是如此,我们依然要小心,比如下面两幅图,绘制的是相同的数据(标普500指数),唯一的差别在于y轴刻度范围。

  是否举得第二张图的波动更加剧烈?但两张图是相同的数据!可见,刻度的范围会影响人们对数据的认知。小的刻度范围会让人觉得数据变化较大(即使数据本身还是一样的数据)。

  因此,一个图表是由数据和绘制方法两方面构成的。图表并不等同于数据,绘制方法有可能会影响人们的主观认识。一个合格数据图表应该尽量客观的反映数据。

  (当然,一个熟悉数据可视化原理的人,也可能会利用这些方法故意夸大。这在宣传海报中常常见到。)

作者:徐志远

来源:IT168

原文链接:通过一个视频剖析数据可视化的秘密

时间: 2024-08-29 02:00:48

通过一个视频剖析数据可视化的秘密的相关文章

数据可视化的秘密

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢!   研究数据的方法有很多,比如利用统计方法,计算数据的平均值和标准差:再比如使用模型,拟合数据.数据通常是大量的,人脑难以直接把握其中的信息.研究数据的最终目的是减小海量数据的信息量,将数据中的信息客观的展示出来,并最终整理成简单的,人脑可以掌握的知识.   数据可视化 图形是直观呈现数据的直接方法.然而,将大量数据在同一个图表中画出来并不容易.早期的测绘.天气数据都需要长时间的

如何做好基于地图的数据可视化?

这个地图是Audubon鸟类和气候变化报告中的一部分,预测了季节变化的区域,黄色代表该地区处于夏季,蓝色代表冬季. 地图具有神奇的能力,可以给我们展示不能直接看到的东西,例如Curiosity在火星上的路径,北达科他州地下水力压裂井的混乱,加州未接种疫苗儿童的簇状分布.对于记者来说,地图既是一个强大的数据可视化工具,也是一个强大的报告工具. "地图是信息密度最大的数据通信方式,"洛杉矶时报的数据可视化主管Len De Groot说.因为人们在日常生活中就使用地图,所以能直观理解地图.L

【干货】21个数据可视化利器

常言道一图胜千言,在网络世界里,图表或者信息图能够极大地强化任何一个设计师所要传达的意图. 如果想要对你的数据有清晰的洞察力,那么你应该知道需要的是什么:数据可视化.接下来我会为大家介绍主流的21款数据可视化工具,相信会成为你的网站分析必备利器. FusionCharts FusionCharts套件特有的动画.精致的设计以及丰富的交互效果会让你觉得整套图表体验特别炫酷.它的跨平台特征很占优势--在PC端, Macs, iPads, iPhones 以及 Android上都有非常出色的表现,同时

一文读懂数据可视化

数据可视化,是指将相对晦涩的的数据通过可视的.交互的方式进行展示,从而形象.直观地表达数据蕴含的信息和规律. 早期的数据可视化作为咨询机构.金融企业的专业工具,其应用领域较为单一,应用形态较为保守.步入大数据时代,各行各业对数据的重视程度与日俱增,随之而来的是对数据进行一站式整合.挖掘.分析.可视化的需求日益迫切,数据可视化呈现出愈加旺盛的生命力,表现之一就是视觉元素越来越多样,从朴素的柱状图/饼状图/折线图,扩展到地图.气泡图.树图.仪表盘等各式图形.表现之二是可用的开发工具越来越丰富,从专业

【独家】一文读懂数据可视化

前言 数据可视化,是指将相对晦涩的的数据通过可视的.交互的方式进行展示,从而形象.直观地表达数据蕴含的信息和规律. 早期的数据可视化作为咨询机构.金融企业的专业工具,其应用领域较为单一,应用形态较为保守.步入大数据时代,各行各业对数据的重视程度与日俱增,随之而来的是对数据进行一站式整合.挖掘.分析.可视化的需求日益迫切,数据可视化呈现出愈加旺盛的生命力,表现之一就是视觉元素越来越多样,从朴素的柱状图/饼状图/折线图,扩展到地图.气泡图.树图.仪表盘等各式图形.表现之二是可用的开发工具越来越丰富,

【大数据100分】冯一村:数据可视化的魅力

"中关村大数据产业联盟"推出"大数据100分"论坛,每晚9点开始,于"中关村大数据产业联盟"微信群进行时长100分钟的交流.探讨. [大数据100分]冯一村:数据可视化的魅力 主讲嘉宾:冯一村 主持人:中关村大数据产业联盟 副秘书长 陈新河 承办:中关村大数据产业联盟 嘉宾介绍: 冯一村:海云科技创始人 .海云数据是一家做数据可视化的的初创公司.海云数据是"微软创投加速器"第四期入驻的企业. 以下为分享实景全文: 冯一村:大家

《JavaScript数据可视化编程》—— 第1章 图像数据1.1 创建基础的柱状图

第1章 图像数据 JavaScript数据可视化编程在很多人的印象中,数据可视化图形是一些非常酷炫复杂.充满科幻设计感的图形.这种看法其实存在误区.实际上,建立一个有效的数据可视化模型并不需要特别深厚的设计功底和复杂的编程技巧,如果你一直牢记着数据可视化的目的是帮助人们更好地理解数据,那么你就会认同,在进行数据可视化的过程中最需要注意的,恰恰是"简单"二字.那些看似简单基础.随处可见的图表及其所传达的信息,往往最容易为人们所理解和消化. 因为用户已经熟悉了各式各样的常规图表,如柱状图.

视频大数据技术在智慧城市建设中的应用

现代社会的信息量正以飞快的速度增长,这些信息里又积累着大量的数据.预计到 2025年,每年产生的数据信息将会有超过 1/3 的内容驻留在云平台中或借助云平台处理.我们需 要对这些数据进行分析和处理,以获取更多有价值的信息.在未来的"智慧城市"中,会有越来越大的结构化以及非结构化的数据.那么我们如何高效地存储和管理这些数据,如何分析这些数据呢?答案是:我们需要强有力的大数据处理系统进行支撑. 作为目前最火热的词汇之一,大数据在各个领域都已有了较为成熟的应用.在视频监控领域,大数据时代正悄

30个最好的数据可视化工具推荐

如今同质化的应用越来越多,应用开发者也开始在用户体验上下功夫,比如数据可视化,将一大堆密密麻麻的数字转成图表形式,可以更直观地向用户展示数据之间的联系和变化情况,减少用户的阅读和思考时间,以便很好地做出决策:目前互联网中有很多数据可视化工具,这里只选择了30个有特色好用的推荐给大家 iCharts iCharts是一个在线的数据可视化工具,被广泛应用于商业/经济/体育等领域的报告中;为了拥有庞大的资料量,它提供以云端为基础和受专利保护的图表工具,让企业和个人都能透过网站把资料分享给数百万的人;i