可视化告诉你,大数据究竟是什么?

导读要深入理解大数据,需要提高数据的可视化水平。在此过程中,数据可以变得更具可塑性、可行性,最终更加人性化。

在谷歌图片搜索有关“大数据”,会出现很多个由三维“0”和“1”组成的图片;有一些解释性的信息图表;甚至出现“黑客帝国”的界面。在人类能够理解的范围内,大数据究竟是什么样子呢?

如果问一家大公司的首席执行官什么是“大数据”,他们可能会描述一些类似于黑匣子(飞机上的飞行记录器)的东西,或者在白板上画一朵云。如果问数据科学家,他们可能会向你解释一下4v的概念,试图使用信息图表(其实只是事实的可视化集合),当然还带有相应地说明。之所以不同人给出不同答案是因为“大数据”是一个有着多种含义、象征,应用于不同组织的模糊术语。

可以理解的是,要想弄明白大数据是发源于哪、什么时候盛行是很难的。从最早开始有记录直到2003年,人类共创造了5EB的数据(五十亿千兆字节)。到了2011年,每两天就会产生这么多的数据。与前几代数据相比,我们正真实现了飞跃式地发展。谈到今天的大数据,数据的呈现方式有助于传递信息,不过它需要的不仅仅是漂亮和表面文章。它必须有效,展现多个维度,还要考虑实用性。

新的软件和技术使得我们能够更深入的理解和利用这些庞大的数据集。然而,我们要去真正收集和加工有价值的大数据,唯一方法是要提高数据可视化的水平。 我们怎样进行可行性分析、深入了解、全面可视化地表示信息呢? 答案是我们需要使数据更人性化。

新的可视化 新的挑战
让大数据有意义,使之更贴近大多数人,最重要的手段之一就是数据可视化。数据可视化是寻路仪,从字面上理解,就如同街头的路标指引你到公路,从象征意义上理解,其颜色、大小或抽象元素的位置都会传达信息。在某种意义上,恰当的可视化标识可以提供较短的路线,帮助指导决策,成为通过数据分析传递信息的一种重要工具。然而,要真正可行,数据可视化应有适当地交互性。它们必须设计良好、易于使用、易于理解、有意义、更容易被人接受。

Michal Migurski说:“数据可视化是一个相对的概念… …通常说它是即将出现在地平线上的新事物。”随着技术的变化而改变,我们不断地开发新的工具以利用它实现跨行业应用。一些熟悉的可视化包括信息图示、臭名远扬的看板,当然还有地图。

现今无所不在的信息图示是解释复杂问题的好方法。在此类别中,Visua.ly是一个很重要的资源。图表通常是在精心制作的海报或演示文稿中来传达意思,但因它们往往是固定时间,当需要提供实时信息就表现地不如人意了。看板(dashboard)或许是一个有用的工具,但它们往往设计的不好。同样的图表和图形重复地出现。

当看板被望文生义地理解为类似车辆仪表盘和里程计时就更糟了。最致命的是当想要通过看板传达有关人的信息时,他们往往不够人性化。最后,地图作为一个依赖于地理的重要的信息层,是我最喜欢的可视化之一。当你可以依靠一个国家或省的地形等可识别的图形处理数据,地图是很有用的,但如果不是地理数据怎么办?

想想谷歌地图,它可以说是现今世界上最全面和最成功的数据可视化集。它提供多种形式的广泛的数据集,不断更新而且相当容易使用。其界面提供满足个人需求和查询数据的多个视图,可以跨设备使用。它还提供了一个强大的API,使其不再仅仅是个软件,而成为一个平台。它的 API能够实现从基础地图功能到呈现难以穷尽的地理信息。

看看Weldon Cooper Center服务大众的 Racial Dot Map(基于谷歌API创建),使用颜色编码描绘了在美国分布的种族多样性(类似于在热图上看早晨的天气报告)。你也可以放大一个特定区域或地区来获取细节(每个人代表一个点,按种族用颜色编码)。

有了谷歌,如何显示信息和组织信息成为了大家关心的问题。但这需要一个群落具有稳健性(400多位谷歌员工在为地理信息产品服务)。然而对于数据可视化来讲,来源越少,风险越小。

数据光谱的另一端,可以看看纽约时报是怎样用视觉效果为它的报道增光加彩的。例如,一篇关于NASA的开普勒任务的报道,记录了超过190个被证实围绕遥远恒星运转的行星,它们在行星轨道上运行的速度,到距离恒星的距离、恒星温度和星系的大小都被加入了浅显易懂的可视化效果。

另一个例子就是用图形描绘丝绸之路,描述这著名的贸易路线的现代版本。彩色照片和精心编辑的视频,按沿路线上的重要地点分组,传达丝绸之路的内涵,旁边有信息图表帮助从地理上理解这些照片和视频。

通过这些可视化成果,你也会开始认识到一些限制,我们是否能够呈现出所有可以想象到的数据(想象一下检查19亿而不是使190颗的系外行星),或者是否需要从多个维度上理解数据。这些例子就像发展大数据可视化的路标。我们从这些零散的示例到更大数据集的应用中又可以学到什么?

大数据才刚刚开始出现,我们管理后端的方式也在不断变化。我们要通过有意义的、交互性的方式,利用强大的工具来可视化数据。我们需要跨学科的团队,而不是单个数据科学家、设计师或数据分析员,我们需要重新思考我们所知道的数据可视化。图表和图形还只能在一个或两个维度上传递信息,那么他们怎样才能与其他维度融合到一起深入挖掘大数据呢?我们的大数据可视化(BDV)工具需要实现更多过功能和更新,而不仅仅是个软件。

在此过程中,数据可以变得更具可塑性、可行性,最终更加人性化。通过灵活的数据和可视化框架,我们希望能容纳多种意见,使我们能够利用数据适应不断变化的需求和查询。接受大数据的模糊性,但要提供并找到让它和你联系的更加紧密的工具。数据的可视化解释会因你的目标和对目标的回应的不同而不同。因此,虽然会存在视觉上的相似之处,但没有两个可视化结果是相同的,就像世界上不可能有完全相同的两片叶子。

原文发布时间为:2015-06-01

时间: 2024-09-20 10:34:58

可视化告诉你,大数据究竟是什么?的相关文章

大数据究竟是什么?

文章讲的是大数据究竟是什么,很多IT人对于这些热门的新技术.新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来.究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很"土鳖";二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然. 我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不想把那些零散的资料碎片或不同理解论述简单规整并堆

互动性可视化,打通大数据最后一公里

可视化,被视为大数据落地的最后一公里.就如同人们去商场购物时,看见一件漂亮的衣服,但2000元略贵的标价或许会让部分用户产生犹豫,而可视化充当的作用就相当于给这件衣服贴上了打8折的标签,为最后的决策提供了助力. 在大数据领域,重要的是数据本身以及从中得到的价值,但同时可视化的推动作用,为不同年纪.不同职责的用户采用大数据提供了更好的体验,降低了认知的壁垒. 商业决策离不开互动性的可视化 目前的大数据可视化呈现,大多数以表格.饼图等方式展示,例如用户比较熟悉的支付宝用户的全年消费记录.虽然类似的可

“HR+大数据”究竟该怎么玩?

在人力资源管理领域里,"HR+大数据"还是一个新鲜出炉待加工的半成品.简单来说,就是知道这是大数据的人力资源管理,但还不会去真正的应用大数据的人力资源管理.而且北大光华的穆胜博士在其写的<大数据为何走不进人力资源管理?>一文中提出"HR可能误会了大数据"也很好的揭示了当前的"HR+大数据"并没有被找到正确的"加工"方式,使得这个半成品的"HR+大数据"有着被玩坏的趋势! 那么"HR+大

可视化:让大数据应用能够“落入寻常百姓家”

先说说大数据的应用:就是大量的能够收集.存储的原始数据,经过各种分析可以揭示一定的行为模式和发展趋势,并提供给终端消费者(客户)使用. 大数据 那么如何在不同的场景下降低消费成本(指客户/用户为实现消费品或服务的效用过程中所付出的代价),即是否有效降低用户获得服务所付出的代价.(PS. 关于消费成本,可以看我之前写的<视野:从消费动机.消费成本的角度对商业化的思考>)无论是深入行业里去提高原有效率.提供数据应用服务解决实际问题,还是通过组织数据做一些商业创新尝试等等,数据应用的价值是非常大的.

6家初创公司做好数据可视化 玩转大数据

数据可视化在数据分析领域算难度最高最具挑战性的部分,但它的重要性却不容我们质疑,实际上,可视化绝对算得上分析数据分析领域最重要的部分之一.当然,存储.数据库的查询处理以及算法都是非常的重要.而且离开它们可视化也无从实现.但是在一个数据驱动的世界里,它们只是处在基本层的位置.下面是6家初创公司,他们试图从根本上改变数据的可视化.其中有一些是高度复杂的可视化处理过程,有些不是.虽然没有一个是完美的,但他们所做的一切,会让我们反思:数据究竟意味着什么? Ayasdi Ayasdi来自印第安语,是"寻找

大数据究竟是什么?一篇文章让你认识并读懂大数据

在写这篇文章之前,我发现身边很多IT人对于这些热门的新技术.新趋势往往趋之若鹜却又很难说的透彻,如果你问他大数据和你有什么关系?估计很少能说出一二三来.究其原因,一是因为大家对新技术有着相同的原始渴求,至少知其然在聊天时不会显得很"土鳖":二是在工作和生活环境中真正能参与实践大数据的案例实在太少了,所以大家没有必要花时间去知其所以然. 我希望有些不一样,所以对该如何去认识大数据进行了一番思索,包括查阅了资料,翻阅了最新的专业书籍,但我并不想把那些零散的资料碎片或不同理解论述简单规整并堆

3D可视化技术:大数据的未来?

在大数据爆炸的时代,跨多个行业的公司都巧妙地汇总数据来精确定位数字.趋势和模式,这是他们改善服务的关键.但随着数据越来越繁琐和复杂,向管理这些数据和提取数据价值的组织提出了一个挑战.在过去的几年中,许多有价值的分析解决方案进入市场,在2013年,3D可视化技术会是一种新的管理.分析和交互数据的方式吗? 今年早些时候,美国总统奥巴马总统也跳上了"大数据的马车",批准了美国国立卫生研究院.国防和能源部门以及美国地质调查局用于大数据的研究和开发项目的2亿美元.这是一个重大的投资,并且验证了来

智物联要做泛工业物联网,工业大数据究竟还有多少种实现形式?

  36氪在<大数据尚处于早期发展阶段,如何判断大数据公司的变现能力?>中曾讨论过工业大数据在大数据产业链的走向和前景,工业互联网化是未来工业发展趋势,<中国制造2025>和工业4.0战略都将大数据作为中国制造转型的关键因素,大数据与物联网发展相辅相成,是工业物联网重要的变现出口.而且国内工业信息化程度低,大部分企业不具备自己开发大数据产品的能力.这些都是大数据公司的机会,之前报道过的大数点和英物智联都是其中代表. 今天介绍的智物联也是工业物联网解决方案提供商,公司服务制造型企业,

大数据究竟值多少钱?

<2015年中国大数据发展调查报告>显示,2015年中国大数据市场规模达到115.9亿元,增速达38%.面对着庞大的市场,不仅各地政府在积极地"圈地",各大数据企业亦在从大数据技术和服务领域寻求商机. 据了解,当前在中国自称为大数据的企业超过400家,拿到融资的企业超过50家,其中拿到过亿元融资的企业超过17家.不过,80%以上的大数据企业年收入低于亿元,赢利者甚少. "现在很多企业.政府等都拥有大量数据,但这仅是'数据大',而不是大数据.真正的大数据,是需要进行