大数据可能是近一年来最时髦的词

大数据可能是近一年来最时髦的词了,大数据真正的本质不在于“大”,而是在于背后跟互联网相通的一整套新的思维。大数据跟传统的数据最大的差别在哪呢?

1.在线。首先大数据必须是永远是在线的,而且在线的还得是热备份的,不是冷备份的,不是放在磁带里的,是随时能调用的。不在线的数据不是大数据,因为你根本没时间把它导出来使用。只有在线的数据才能马上被计算、被使用。

2.实时。大数据必须实时反应。我们上淘宝输入一个商品,后台必须在10亿件商品当中,瞬间进行呈现。如果要等一个小时才呈现话,我相信没有人再上淘宝。十亿件商品、几百万个卖家、一亿的消费者,瞬间完成匹配呈现,这才叫大数据。

3.全貌。大数据还有一个最大的特征,它不再是样本思维,它是一个全体思维。以前一提到数据,人们第一个反应是样本、抽样,但是大数据不再抽样,不再调用部分,我们要的是所有可能的数据,它是一个全貌。其实叫全数据比大数据更准确。

这是大数据的三个本质,在线、实时、全貌。

大数据的3个典型特征

为了让大家对大数据有更多的理解,我再把它展开跟大家讨论一下。大家做企业,最容易想到的两个数据应用,一个是市场调研,派个市场公司或市场部门做一个调查,去看下各公司什么反馈。第二个就是商业智能BI、数据挖掘,查看数据经营的报表。这是最传统的两个数据应用。这样的数据应用有几个典型特征:

1.要知道准备达成的目标,从而主动收集这些数据。由于每个企业的计算能力跟成本不一样,数据数据保留多少时间、哪些数据能用,是有所不同的。而大数据是实时的记录数据。原则上,任何人上任何一个网站、做的任何事情,所有事情都会被记录下来,没有人事先做区分。所以大家不再去问,是数据就记录下来,所以这是第一个差别。

2.参与的人不再是有意识的参与,而是无意识的参与,你是为自己的利益在做事情。你用一次搜索,你就参与了谷歌的大数据搜集,因为你的每次点击就是一个数据来源。如果让你参加一个市场调研,80%的情况下你会拒绝,15%的情况下你可能会要求某种意义上的补偿。很少有人愿意主动的参加市场调研,因为对你来说是个负担。但是线上的大数据对绝大部分人来说,完全是一个无意识的、自利的行为。我上淘宝就是为了买东西,我上微博是为了看新闻,我上百度是为了搜索,你都是为了自己利益而触发的一个无意识的行为,但这个无意识的行为,都为大数据做了贡献。

3.一个是单向,一个是双向。我们以前做的数据分析也好,都是先假定一个目的,然后拿到现成的数据,分析行为,来测试我的猜测。这些都是有一个单向的主导。大数据本质上一定是双向的,就像搜索,你点击搜索引擎点击的时候,你是给它输入了数据,它给你的结果就是它与你的互动,就是它带给你的数据价值。这个大数据本身也在随时为你创造价值,这样的话就变成一个双向互动的正循环,双方都给对方贡献了数据价值。任何大数据应用,如果在设计时就没有这种双向、互利的正循环的话,是跑不起来的,本质上就不是大数据。

大数据应用,反应速率才是关键

最后,我还想强调的是反应速率——大数据的数据价值越大,它的反应速率就要越高。比如说谷歌的搜索,你输入一个关键字看到的结果,跟一个小时以后再输入同样的关键字得到的结果,很可能已经不一样了。因为它已经把一个小时内全球所有的点击重新计算了一遍,然后把信息做了结果优化再反馈给你。

所以,大家可以想想看,反馈的速度越快,它创造的价值越大,消费者参与的动机就越大。数据越跑越大、反应越来越快、结果越来越好、用户参与会越来越大,才能变成一个黑洞效应。这是我想讲的大数据的核心概念。

时间: 2024-11-03 12:52:01

大数据可能是近一年来最时髦的词的相关文章

破解大数据盈利困局 人工智能成突破口

大数据是眼下各行各业都在谈论的时髦热词,很多数据分析报告总是冠以"大数据"的标题,资本市场也是如此,政府.传统制造业.电信运营商.互联网巨头无不在大数据上巨额投入,规划产业园,建设数据中心,成立以大数据为主要业务的新部门或新公司. 几乎每天我们都能看到新的大数据项目启动的消息,却很少见到大数据产品的报道:与动辄数千万乃至上亿元的资金投入相比,鲜有公司发布关于大数据所带来的收入,宣布获得利润的更是少之又少. 那么,大数据的变现渠道何在? 大数据盈利远未实现 存储技术的迅速发展使得每单位存

大数据,入行恰逢其时

大数据,入行恰逢其时,近几年,大数据不可谓不火,尤其是2017年,发展大数据产业被写入政府工作报告中,大数据开始不只是出现在企业的战略中,也开始出现在政府的规划之内,可以说是互联网世界的宠儿. 1.大数据的重要性 近几年,随着科技的发展,计算机技术的飞速进步,大数据以及智能运维显得越发重要. 从大的方面来讲,大数据在推动中国经济转型方面将发挥重要作用: 其一,通过大数据的分析可以帮助解决中国城镇化发展中面临的住房.教育.交通等难题.例如,通过对交通流量数据的实时采集和分析,可以知道驾驶者选择最佳

大数据研究常用软件工具与应用场景

如今,大数据日益成为研究行业的重要研究目标.面对其高数据量.多维度与异构化的特点,以及分析方法思路的扩展,传统统计工具已经难以应对. 工欲善其事,必先利其器.众多新的软件分析工具作为深入大数据洞察研究的重要助力, 也成为数据科学家所必须掌握的知识技能. 然而,现实情况的复杂性决定了并不存在解决一切问题的终极工具.实际研究过程中,需要根据实际情况灵活选择最合适的工具(甚至多种工具组合使用),才能更好的完成研究探索. 为此,本文针对研究人员(非技术人员)的实际情况,介绍当前大数据研究涉及的一些主要工

全球大数据产业发展现状与应用趋势

1 .大数据发展概述 当今是一个数据爆发增长的时代.移动互联网.移动终端和数据传感器的出现,使数据以超出人们想象的速度快速增长.据调查机构估测,数据数量一直在快速增加,这个速度不仅是指数据流的增长,而且还包括全新的数据种类的增多.目前数据容量增长的速度,已经大大超过了硬件技术的发展速度,并正在引发数据存储和处理的危机.据统计,2013年全球产生的数据达到3.5泽字节,到2020年产生的数量将增至44泽字节. "大数据"一词来自于未来学家托夫勒于1980年所著的<第三次浪潮>

全球各国大数据市场的发展现状

1 大数据发展概述 当今是一个数据爆发增长的时代.移动互联网.移动终端和数据传感器的出现,使数据以超出人们想象的速度快速增长.据调查机构估测,数据数量一直在快速增加,这个速度不仅是指数据流的增长,而且还包括全新的数据种类的增多.目前数据容量增长的速度,已经大大超过了硬件技术的发展速度,并正在引发数据存储和处理的危机.据统计,2013年全球产生的数据达到3.5泽字节,到2020年产生的数量将增至44泽字节. "大数据"一词来自于未来学家托夫勒于1980年所著的<第三次浪潮>.

叶炜晨:视频遇上大数据,会擦出什么火花

文章讲的是叶炜晨:视频遇上大数据,会擦出什么火花,在近期的视频网站大会上,除了"独播"这种老生常谈的话题,大数据名副其实当选为视频网站宣传时最爱的词,爱奇艺也不例外.早在2013年,爱奇艺就着手将大数据"落地",并研发了一套实时数据采集计算的综合解决方案-Venus.实时数据采集对视频行业到底意味着什么?当视频遇上大数据到底会擦出什么样的火花?这些谜题都会由本期采访嘉宾--叶炜晨,一一揭晓. ▲叶炜晨 叶炜晨,毕业于上海交通大学计算机系.2013年加入爱奇艺云平台,

TalkingData CEO崔晓波:企业如何通过移动大数据实现更好的发展?

据工信部预测数据计算,2017年中国大数据产业规模近2万亿人民币,2020年将增长至5万亿,年复合增速达35.7%.而作为其中的移动大数据,更是由于手机.可穿戴设备等与人们生活越来越密切而成为大家关注的焦点. 借势大数据的火热风口,国内领先的独立第三方移动数据服务平台TalkingData连续三年实现了业务的三倍快速增长.在 T11 2017暨TalkingData智能数据峰会的间隙,TalkingData CEO 崔晓波结合 TalkingData 多年来与企业的合作,谈了他对于企业如何通过移

大数据将是未来最重要的生产资料?

大数据,是近几年内最为热门和重要的技术话题.8月31日,百度百家举办的第三期BIG,请来了可穿戴设备和大数据领域享有盛誉的世界级权威教授Alex Pentland,与百度百家共同探讨大数据和可穿戴设备的未来.Alex Pentland直言他在生活中并不怎么使用可穿戴设备,因为现在技术和应有都不太成熟,这种判断我也很认同,下文中我们将重点讨论大数据话题的讨论上. 大数据的价值是否被高估了? 现在单纯地讨论大数据是没有现实意义的,它必须跟云计算相结合才能发挥出应有的作用.完整的大数据应用应该包括数据

知名大数据专家杨正洪博士加入SinoBBD

文章讲的是知名大数据专家杨正洪博士加入SinoBBD,4月17日消息,北京供销大数据集团(SinoBBD)宣布,国内外知名大数据专家杨正洪博士正式加入集团,并将担任SinoBBD大数据管理平台负责人.杨正洪博士将主要负责集团大数据管理平台的开发及运营,主持大数据相关产品的自主创新设计,推动政企用户对大数据自主可控平台的应用拓展. ▲图为国内外知名大数据专家杨正洪博士 作为国内外知名的大数据专家,杨正洪博士在大数据领域拥有近20年的从业经验,深刻洞察该领域的产品创新和市场需求.2003年,杨正洪在